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ПРЕДИСЛОВИЕ 


Традиции преподавания биометрии в пашей стране берут 
начало от Ю. А. Филипченко, С. С. Четверикова, А. А. Сапе- 
гина. В 50-е годы существенный вклад в совершенствование 
преподавания биометрии, в пропаганду биометрических METO- 
дов внесли П. Ф. Рокицкий, П. В. Терентьев, Н. А. Плохин- 
ский. Главная особенность отечественной биометрической шко- 
лы заключается в стремлении к предельной биологизации 
статистических методов, в наглядном показе биологического 
смысла любой статистической процедуры, в попытке дать био- 
логическую интерпретацию значениям любых статистических 
параметров п изменениям этих значений. Не случайно деяте- 
лям русской биометрической школы удалось получить ряд 
изящных, имеющих глубокий смысл результатов в генетике, 
ботанике и зоологии, в растениеводстве и животноводстве, что 
требовало обширных биологических познаний. 

Но где сила, там и слабость. Отечественные биометрики 
никогда не строили математико-статистическую 
модель, имеющую, если можно так выразиться, свою 
«жизнь». Строгая формулировка модели всегда связана с вве- 
дением упрощающих условий, с возникновением специальных, 
чисто математических задач. Применение же соответствующе- 
го математико-статистического метода в биологии сводится к 
установлению допустимости применения математической MO- 
дели к соответствующей биологической ситуации. Такой под- 
ход отнюдь не снижает требований к уровню математической 
подготовки биолога и составляет основу, на которой формиру- 
ется то, что обозначают словами «статистическое мышление», 

Этим путем развивается англо-американская биометриче- 
ская школа, по сути дела берущая пачало от основополагаю- 
щей книги Р. А. Фишера «Статистические методы для иссле- 
дователей». Стиль изложения предмета представителями этой 
школы нашел, пожалуй, наиболее полное отражение в пере- 
веденной у нас книге Н. Бейли [1962]. Автор излагает суть 
статистической модели, ее ограничения и, полностью опуская 
все процедуры математических выводов и выкладок, сразу да- 
ет копечные формулы для вычислепий. 


Такая, чисто словесная формулировка статистической за- 
дачи (скорее, рассказ о задаче) и отсутствие указаний на пу- 
ти статистического вывода требуют от читателя очень боль- 
шого внимания, напряженной мыслительной работы, и даже 
если эта работа оказывается успешной, подчас остается неяс- 
пой логика (последовательность) статистического вывода. По- 
видимому, все-таки невозможно, говоря о математических MO- 
делях, полностью избежать использования математических 
формализмов. Нам представляется, что книги В. Ю. Урбаха 
[1964, 1975] являются существенным этапом на пути решения 
этой проблемы. 

Точка зрения авторов данного учебного пособия на основ- 
ные принципы преподавания биометрии сводится к следующе- 
му. Курс биометрии — это лишь один из этапов университет- 
ского математического образования студентов-биологов. При- 
чем не первый этап. Начало должно быть положено курсом 
общей математики, что сейчас и делается. Заметим лишь, что 
принципы и объем курса общей математики по традиции во 
многом связаны пока со способом и объемом преподавания 
математики в технических вузах. 

Второй этап — курс основ (наверное, правильнее, элемен- 
тов) теории вероятностей и математической статистики. Логи- 
чески, исходя из несомненно существующей специфики био- 
логических приложений вероятностно-статистических методов 
изложение теории вероятностей относится к этому этапу, а не 
к курсу общей математики. Второй этап и есть собственно курс 
биометрии в нашем понимании. Главное здесь — дать поня- 
те о вероятностной и статистической MO- 
дели и провести четкое разграничение между моделью и ее 
биологическим приложением. Статистическая модель — это фе- 
номен математический, ее структуру, функционирование и вы- 
тскающие из нее следствия нельзя описать чисто словесно, 
полностью отказавшись от формализмов математического язы- 
ка. Полное упрощение неизбежно повлечет за собой искаже- 
ние смысла. Поэтому возникает вопрос об уровне строгости 
изложения. Принять совремепный уровень строгости теории 
вероятностей и математической статистики — дело немысли- 
мое. Это означало бы превращение биолога в математика. 
Поэтому мы избираем уровень строгости изложения, близ- 
кий уровню строгости, принятому в технических вузах. 

Выбор статистических методов, даваемых в курсе биомет- 
рии, сегодня вряд ли вызывает епоры. В этом отношении и 
наше пособие не отличается новаторством. Однако нам пред- 
ставляется важпым изложение разных методов с единой TON- 
ки зрения, поэтому мы строим курс на основе нормального 
распределения. 

Разумеется, методы, излагаемые в курсе биометрии, состав- 
ляют лишь небольшую часть возможных приложений матема- 
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тико-статистического аппарата. Но ведь биометрия — лишь 
второй этап математического образования биологов. Необхо- 
дим и имеет место третий этап — математические (в том числе 
и статистические) методы специальных биологических дисцип- 
лин (микробиологии, зоологии, ботаники, генетики, биохимии, 
физиологии ит. д.), на котором и решаются более сложные, 
более специальные задачи, опускаемые в курсе биометрии. 

Построение и анализ в курсе биометрии математико-стати- 
стических моделей не должны лишать нас ярких достоинств 
русской биометрической школы: биологического взгляда на 
количественные методы. Нам представляется, что таким ду- 
хом должен быть проникнут весь курс. В значительной мере 
это достигается собственно приложениями — практическими 
занятиями, решением задач. Прежде всего биологические при- 
меры, рассматриваемые в курсе, должны быть содержа- 
тельпыми: не просто выдуманными примерами, но реально 
возникающими в разных областях науки задачами. И реше- 
ние этих задач должно заключаться не в рецептурной подста- 
новке в вычислительные формулы эксиериментальных дан- 
ных, а в обоснованном выборе статистической модели. 


Такого рода подход, по-видимому, никогда раньше не прово- 
дился сколько-нибудь последовательно в биометрии. И 
если это привлечет внимание читателя и позволит студентам 
овладеть не только рецептурой и техникой статистических вы- 
кладок, но и основами вероятностио-статистического мышле- 
ния, то авторы будут считать свою задачу выполненной. 


Над всеми разделами пособия все авторы работали совме- 
стно. Если даже первоначальный вариант той или ипой главы 
был написан одним из нас, в дальнейшем он перерабатывал- 
ся, дополнялся другими. 


Авторы выражают сердечную признательность научному 
редактору профессору М. М. Тихомировой, сделавшей воз- 
можным написание этой книги. Маргарита Михайловна «при- 
няла» курс «Биометрии» в Ленинградском университете от 
Павла Внкторовича Терентьева, определила пути развития и 
совершенствования этого курса и передала его авторам — 
Н.В. Глотову n H. H. Хромову-Борисову. 


Мы благодарны проф. С. Г. Инге-Вечтомову, энергично 
стимулировавінему нашу работу на всех этапах. Мы призна- 
тельны О. И. Белозеровой, М. В. Голубковой, Н. В. Носкову 
за неоцениму:о помощь в подготовке пособия к > печати, 
М. И. Рахману за вычисление некоторых значений в табл. VI 
и УП Приложения, В. М. Кузнецовой за техническую подго- 
товку рукописи. 


Выражаем признательность всем коллегам, предоставив- 
шим результаты своих исследований для составления многих 
задач и примеров. 


In 


ОСНОВНЫЕ ОБОЗНАЧЕНИЯ 


(В скобках указаны параграф и глава, в которых вводится данное 
обозначение) 


Знак ~ («тильда») ставитс:; над буквой и обозначает случайную Be- 


личину, например x (6 10 гл. I). 
Буква без тильды есть значение соответствующей случайной величины, 


например х есть значение случайной величины х. 
Индекс «эксп» означает, что значение статистики вычислено по экспери- 
ментальным (выборочным) данным, например рок ($ 2 гл. IV). 


Обозначение х--Х(Ө), Ө) означает, что случайная величина х имеет 
Х-распределение с параметрами 6, и В» (5 3 гл. ІП). 
Знак © — пустое множество, невозможное событие ($ 2, 3 гл. 1). 


Буквами греческого алфавита обозначаются: 


о — уровень значимости критерия ($ 2 гл. ІМ); 
В — коэффициент линейной регрессии ($ 1 гл. ІХ); 


В. — статистика критерия Колмогорова для проверки нормальности распре- 
деления (6 5 гл. УЦ); 
= комплекс условий случайного испытания @ (6 1 гл. I); 
— Параметр рассеяпия неизвестного распределения (6 7 гл. УІ); 
б — медиана распределения случайной величины ($ 1 гл. Ш); 
х ИЛИ Хо — свободный член в уравнении линейной регрессии ($ 1 гл. ІХ); 
А, — параметр распределения Пуассона ($ 4 гл. 11); 
и — среднее значение нормального распределения ($ З гл. ІП); 
у — число степеней сзободы ($ 7 гл. ІП); 
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р или р(хь, хг) — коэффициент корреляции двух случайных величин Х И х 
(62 гл. HI); 

05 — коэффициент ранговой корреляции Спирмена ($ 9 гл. ІХ); 

Pw — коэффициент внутриклассовой корреляции ($ 4 гл. VIH); 

с — среднее квадратичное отклонение нормального распределения ($ З 
гл. ПІ); 

o? — дисперсия нормального распределения (6 З гл. ПІ); 

т — параметр положения неизвестного распределения ($ 7 гл. УІ); 

Ф(и) — символ функции нормированного нормального распределения ($ 4 
гл. ІП); 


y? — случайная величина, имеющая %2-распределение ($ 7 гл. ІП); статистика 
критерия x? (гл. УП); 

Х2(у) — символ 92-распределения с параметром v ($ 7 гл. Ш); 

© — множество элементарных событий; достоверное событие ($ 1, З гл. 1); 

о; — элементарный исход случайного испытания @($ | гл. 1); 

{о :} — элементарное случайное событие ($ 3 гл. 1). 


Буквами латинского алфавита обозначаются: 


$ — алгебра случайных событий ($ 2, З гл. 1); 
‚ В,...— случайные события ($ З гл. 1); 
а или ао — оценка свободного члена х или хо в уравнении линейной регрес- 
сии ($ 2 гл. [Х); 
b — оценка коэффициента. линейной регрессии В ($ 2 гл. ІХ); 


Соу(х1, Хо) — ковариация случайных величин хі и Хо ($ 2 гл. ІП); 
Dx — дисперсия случайной величины х ($ 1 гл. П); 

Dx — среднее квадратичное отклонение случайной величины х ($ 1 ra. II); 
а: — разность значений Хи--Хо: в случае парных наблюдений ($ З гл. УІ); 
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Da — статистика критерия Колмогорова ($ 5 гл. УП); 
Ф — случайное испытание ($ 1 гл. 1); 


т“ 


е; или е; — случайные ошибки в моделях дисперсионного анализа ($ 1, 4, 5 
гл. ҮШІ); 


Ех — математическое ожидание или среднее значение случайной величины х 
($ 1 гл. П); 
ғ 


Е — случайная величина, имеющая Е-распределение ($ 9 гл. ІП); статистика 
Е-критерия ($ 1 гл. УГ; гл. МІП); 
Е(уь уг) — символ Е-распределения с параметрами у и уз ($ 9 гл. ІП); 


m~a 


F(x) — функция распределения случайной величины х ($ 10 гл. 1); 


f(x) — плотность распределения случайной величины х ($ 1 гл. HI); 
С (и) — производящая функция целочисленной случайной величины ($ 3 
гл. П); 


— 


H — статистика критерия Крускала — Уоллиса ($ 7 гл. VHI); 

Но — символ нулевой (проверяемой) гипотезы ($ 2 гл. IV); 

Н, — символ альтернативной (конкурирующей) гипотезы ($ 2 гл. IV); 

h — частота, оценка параметра р биномиального распределения ($ 1 гл. У); 

#(А) — частота случайного события А ($ 4 гл. 1); 

#(А; п) — частота случайного события А в последовательности п случайных 
испытаний ($ 4 гл. 1); 

Е — значение цслочислеиной случайной величины, имеющей пуассоновское 
или биномиальное распределение ($ 4, 5 гл. П); 

L — символ функции правдоподобия (6 | гл. V); 

т — оценка среднего значения и нормального распределения или оценка Ia- 
раметра А распределения Пуассона ($ 1 гл. V); 


та — оценка среднего значения для разностей Хіі--Хөі в случае парных ila- 
блюдений ($ 3 гл. УТ); 2 

М$а — символ среднего квадрата между блоками ($ 5 гл. VIII); 

MS» — символ межгруппового среднего квадрата ($ 1 гл. VIII): 

М5 — символ внутригруппового среднего квадрата ($ 1 гл. ҮШІ); 

N (p; 02?) — символ нормального распределения с параметрами u и 67 ($ 3 
гл. Ш); 

М№ (0; 1) — символ нормированного нормального распределения ($ 3 гл. HI); 

п или N — объем выборки ($ 1 гл. ТУ); 

P(A) — вероятность случайного события А ($ 5 гл. |); 

Р(А/В) — условная вероятность события А при реализацин события В ($ 6 
гл. 1); 

р — параметр биномиального распределения (6 5 гл. П); 

{р:) — распределение вероятностей целочисленной случайной велич чы ($ 1 
гл. П); 

К(х.) или А: — paur выборочного значения х; ($ 9 гл. ІХ); 


г — статистика коэффициента корреляции Пирсона ($ 6 гл. ІХ); 


Гв — статистика рангового коэффициента корреляции Спирмена ($ 9 гл. ІХ); 
го — оценка коэффициента внутриклассовой корреляции ($ 4 гл. VII); 
55а — символ суммы квадратов между блоками ($ 5 гл. VHI); 
55, — символ межгрупповой суммы квадратов ($ 1 гл. ҮШІ); 
55, — символ общей (полной) суммы квадратов ($ 1 гл. VHI); 
$5» — символ внутригрупповой суммы квадратов ($ 1 гл. УП); 


S — оценка средисго квадратичного отклонения с нормального распределения 
($ 1 гл. У); 


s? — оценка дисперсии 6? нормального распределения ($ 1 гл. М); 


Sè — стандартная ошибка выборочного коэффициента линейной регрессии b 
(5 2 гл. ІХ); 


Sm — стандартная ошибка выборочного среднего т (6 3 гл. М); 


і — случайная величина, имеющая !-распределение ($ 8 гл. ПТ); статистика 
і-критерия ($ 2, 3 гл. МІ); | 

і(у) -- символ 1-распределения с параметром v ($ 8 гл. ІП); 

И — статистика критерия Вилкоксона — Манна — Уитни ($ 7 гл. МІ); 


и — нормированная нормальная случайная величина ($ 3 гл. ПІ); статистика 
и-критерия ($ 4 гл. VI); 


W — статистика парного критерия Вилкоксона ($ 8 гл. УІ); 


іх:; ра)- распределение вероятностей дискретной случайной величины х 
($ 1 гл. П); 

Ха) -- выборочное значение, имеющее ранг К; ($ 1 гл. IV); 

2 — оценка медианы 6 распределения (6 6 гл. М); 

2 — фишеровское преобразование коэффициента корреляции Пирсона г ($ 8 
гл. [Х); 

г“ — преобразование Г. Хотеллинга для коэффициента корреляции Пирсона 
($ 8 гл. ІХ). 


ВВЕДЕНИЕ 


МАТЕМАТИЧЕСКИЕ ИДЕИ В БИОЛОГИИ 
И ПРЕДМЕТ БИОМЕТРИИ 


Эволюционная теория Ч. Дарвина явилась по существу 
первой естественнонаучной теорией, которая привнесла в ис- 
следования вероятностный дух. Анализ взаимоотношений меж- 
ду такими исходными понятиями эволюционной теории, как 
изменчивость, наследственность и отбор, оказался бы несостоя- 
тельным без того, что сейчас называется вероятностным сти- 
лем мышления. Развитие математических идей в биологии не- 
разрывно связано также с именем Г. Менделя и возникнове- 
нием генетики, законы которой по самой своей природе явля- 
ются вероятностными. И сегодня исследование проблем орга- 
низации, функционирования, взаимодействия и эволюции жи- 
вых систем уже немыслимо без привлечения идей и методов 
теории вероятностей, математической статистики и других раз- 
делов математики. 

Еще ученые и мыслители прошлых столетий (И. Ньютон, 
П. Лаплас, И. Кант, Д. И. Менделеев и многие другие) при- 
шли к выводу, что точность и уровень той или иной области 
человеческих знаний определяются степенью использования 
соответствующим разделом науки математических методов. 
Последнее возможно, как правило, при условии проведения 
количественных экспериментов и наблюдений, когда до- 
статочно строго определены основные исходные понятия, ког- 
да известно, какие величины и как следует измерять. Чрезвы- 
чайное многообразие проявлений жизни на Земле, изобилие 
биологических форм и функциональных связей приводят, одна- 
ко, к тому, что биология сегодняшнего дня имеет перед собой, 
а биология дня завтрашнего, по-видимому, будет иметь целый 
ряд качественных задач, где применепие математиче- 
ских, в частности математико-статистических, методов вовсе 
не требуется. Хороший пример тому — сравнительно недавнее 
исследование лепинградского зоолога проф. А. В. Иванова, 
сумевшего выделить повый тип животных Pogonophora. Под- 
черкнем, что речь идет об открытии типа — высшей системати- 
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ческой единицы в царстве животпых! Недаром эта работа бы- 
ла удостоена Ленинской премии. Несомненно, качественные 
задачи существуют и будут существовать не только в класси- 
ческих областях биологии — в систематике, анатомии, гисто- 
логии, — но и в Таких относительно новых, бурно развиваю- 
щихся отделах биологии, как генетика, биохимия и биофизика, 
физиология. 

В то же время ни один биолог, в том числе начинающий, 
знакомый с нашей наукой лишь по популярным статьям и 
книгам, не станет отрицать, что ее стволовым направлением, 
ее будущим является развитие мышления, количественного по 
сути, связанного с внедрением методологии и методов наибо- 
лее развитых отраслей естествознания — математики, физики, 
ХИМИИ. 

В самых различных областях теоретической и прикладной 
биологии — Опогеоценологии и почвоведепии, систематике и 
экологии, генетнке и биохимии, биофизике, физиологии, в ча- 
стпых отделах зоологии, ботаники, микробиологии — в пасто- 
ящее время эффективно используется разнообразный матема- 
тический аппарат. Это теория матриц, дифференциальные и 
интегральные уравнения, теория вероятностей, математическая 
статистика и т. д. По-видимому, можно утверждать, что прак- 
тически любой раздел математики (даже столь абстрактный, 
как топология) используется сегодня для решения тех или 
иных биологических задач. 

Биометрия — область научного знания, охватывающая 
планирование и анализ результатов количественных биологи- 
ческих экспериментов и наблюдений методами математиче- 
ской статистики. 

Современный количественный эксперимент включает в себя 
самостоятельное математико-статиетическое исследование, ко- 
торое начинается со статистического планирования экспери- 
мента, т. е. организации его постановки, и завершается стати- 
стической обработкой полученных результатов. Поэтому био- 
метрия находит себе все более широкое обшебиологическое 
применение, ибо задачи, которые она решает — планирование 
экспериментов и анализ их результатов, — составляют основу 
экспериментальной работы в любой частной области биологин. 
Можно сказать, что биометрия есть математическая культура 
биологического эксперимента. 

Базой для построения статистических моделей в биологии, 
как и в любой другой области естествознания, техники, эко- 
номики, социологии, является теория вероятностей. Поэтому 
мы начинаем курс с изложения основ теории вероятностей. 


«Замечательно, что наука, KOTO- 
рая начала с рассмотрения азартных 
игр, обещает стать наиболее важным 
объектом человеческого знания... 
Ведь большей частью важнейшие жиз- 
пенные вопросы являются на самом 
деле лишь задачами из теории веро- 
ятностей». 


H. JJanaac 
ГЛАВА I 


ОСНОВНЫЕ ПРЕДСТАВЛЕНИЯ ТЕОРИИ 
БЕРОЯТНОСТЕЙ 


Понятия случайности и вероятности обсуждаются в тече- 
ние последних двух тысяч лет, что привело к накоплению мно- 
гочисленных и дополняющих друг друга точек зрения. К на- 
стоящему времени теория вероятностей сформировалась в ви- 
де обширной и сложной математической дисциплины, опираю- 
щейся на методы, заимствованные из различных отделов со- 
временной математики. Для определения вероятностных поня- 
тий используется аппарат теории множеств и теории меры, 
функционального анализа, линейной алгебры, топологии ит. п. 
Это превращает теорию вероятностей в высшей степени абст- 
рактную науку. Глубина развития математического аппарата 
обеспечивает успешное применение теории вероятностей во 
многих областях науки и техники. На вероятностных методах 
основаны контроль промышленной продукции, расчеты артил- 
лерийской и ракетной стрельбы, траекторий космических аппа- 
ратов, модели экономических, физических, химических и био- 
логических процессов. Теория вероятностей успешно применя- 
ется при планировании и обработке результатов научных экс- 
периментов, при конкретных социологических и психологиче- 
ских исследованиях, при проектировании сложных технических 
систем. Трудно назвать хотя бы одну область науки и техни- 
ки, в которую в той или иной мере не проникали бы вероят- 
ностные методы. Это дает повод некоторым ученым говорить 
о стохастической революции в современном научном мыш- 
лении. 


Биометрические методы представляют собой одну из важ- 
ных областей применения теории вероятностей, имеющей свою 
специфику. Поэтому далее мы будем излагать тот фрагмент 
общей теории, следствия из которого непосредственно исполь- 
зуются в биометрии и понимание которого необходимо для 
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интерпретации биометрических схем. Ряд других понятий 
вводимых в первых главах, необходим для целостного пред 
ставления и изложения основных идей теории вероятностей 
служит, образно выражаясь, воротами в стохастический мир 


$ 1. СЛУЧАЙНОЕ ИСПЫТАНИЕ 


Начнем с представления об испытании, которое будем обо 
значать символом 6. Понятие испытания (6 предполагае 
определение некоторого комплекса условий испытания — обо 
значим его у— и регистрацию связанного с этим комплексо! 
условий паблюдаемого исхода испытапий, который мы буде; 
обозначать о. Комплексы условий и наблюдаемые исходы ис 
пътапий могут иметь различную природу. Это физические и 
биологические явления и процессы, «мысленные» эксперимен- 
ты и т. д. Поясним сказанное несколькими примерами. 

Пример 1-1. Испытание 6 состоит в бросании монеты и 
наблюдении стороны, оказавшейся сверху. Здесь комплекс 
условий ү описывается хотя и довольно нзопределепными, по 
практически одинаково понимаемыми требованиями «правиль- 
ности» монеты (т. е. предполагается, что MONETA с"мметрич- 
ная, изготовлена из одисродного материала и т. д.), необ::0- 
димости «кувыркания» мопеты при падении, отсутствия поел 
пятствий на плоской поверхности в окрестности падепция MO- 
петы и т. п. Исходом о этого испытания 6 служит наимеко- 
вание верхпей стороны упавшей мопеты, т. е., имеются два 
варианта исхода о: «герб» (о--о!) и «решка» (o= 00). 

Различные варианты исхода о мы будем называть эле+ 
ментарными исходами испытания 6 и обозначать той же бух 
ВОЙ о, НО с различными индексами Ot, Oi... 

Пример 1-2. Испытание 6 состоит в бросании кубика (иг- 
ральной кости), на каждой грани которого указано число 
очков (от | до 6), и наблюдении стороны, оказавшейся сверху. 
Комплекс условий ү здесь имеет тот же характер, что и в 
примере 1-1, а исходом испытания о служит число очков, yka- 
занное па верхней грани упавшей кости. Таким образом, име- 
ются шесть элементарных исходов испытания (6: выпало одно 
очко, выпало два очка и т. д., выпало шесть очков (о-< 1; 
09==2; пазар о06--6). 

Приведенные примеры показывают, что понятия испытания 
6, комплекса условий ү и исхода о являются взаимосвязан- 
пыми понятиями. Исход испытания, а следовательно, и само 
испытание можно определить различными способами в зави- 
симости от цели или возможности исследователя. Допустим, 
что по условиям игры исследователь различает грани только 
с четными (2, 4, 6) и нечетными (1, 3, 5) числами. Тогда ис- 
ход в” включает лишь два элементарных исхода: о, — «чет» 
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и®. — «нечет», и при том же комплексе условии ү мы должны 


говорить об испытании 6’. 


Пример 1-3. Испытание 6 состоит в скрещивании гетеро- 
зиготных особей Аа и наблюдении генотипа потомка. Komm- 
лекс условий ү включает образование яйцеклетки, несущей 
аллель А или а, в процессе оогенеза; образование спермия, 
несущего аллель А или а, в процессе сперматогенеза; слияние 
гамет с образованием зиготы; процесс развития потомка до 
той стадии онтогенеза, на которой будет учитываться его гено- 
тип, и т. д. Исход о есть генотип потомка. Здесь возможны 
три элементарных исхода: о, — доминантная гомозигота АА, 
о; — гетерозигота Аа и оз — рецессивная гомозигота аа. Ес- 
ли исследователь учитывает лишь сумму гомозигот АА и аа, 
мы должны говорить об испытании 6”, комплексе условий у 
и исходе о” с двумя элементарными исходами: о; — гомози- 


гота АА или аа и о, — гетерозигота Аа. Если исследователь 


пе в состоянии различить потомков АА и Аа, мы должны рас- 
сматривать испытание &”, комплекс условий у и исход o” 
с друмя элементарными исходами: о, — потомок имеет до- 


минантпый признак (гепотип АА или Да) n о, — потомок име- 
ет рецессивный признак (генотип аа). 


Пример 1-4. Испытание 6 состоит в измерении роста при- 
зывника в военкомате. Здесь комплекс условий ‘у описывается 
инструкцией по измерению антропометрических показателей, 
а исход о) есть записываемое в журнал число, характеризую- 
шес рост призывника в сантиметрах. Элементарными исходами 
ог служат целые числа из некоторого диапазона, определяе- 
мого наименьшим и наибольшим измеренным ростом. 


Любое измерение количественного, или мерного, признака, 
производимое, скажем, с помощью линейки, торзионных весов, 
спектрофотометра и т. I., может быть представлено как испы- 
тание 6. Комплекс условий ү будет определяться всеми теми 
предосторожкостями, которые предусматривает научная мето- 
дология измерения данного показателя. Наблюдаемый исход 
есть регистрируемое числовое значение. Вследствие конеч- 
ной точности любого измерительного прибора элементарнымн 
исходами такого испытания являются рациональные числа. 
Однако теория дальнейшей математической обработки резуль- 
татов измерений становится, как правило, гораздо проще, если 
допустить возможность бесконечно точного измерения, т. е. 
допустить в качестве элементарных исходов ®; любые дейст- 
вительные числа. 


Рассматривая испытание 6, в теории вероятностей пред- 
полагают, что это испытание может быть реализовано бес- 
конечное число раз. Мы абстрагируемся, отвлекаемся от 
ограниченности наших сил и средств и предполагаем возмож- 
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ность бескопечного повторения одпого и того же комплекса 
условий ү. | 

При этом возможны два принципиально разных отноше 
ния между комплексом условий ү и исходом о. С одной сто 
роны, при повторении комплекса условий у мы можем всегда 
получить один и тот же единственный элементарный исход 
оо; такое испытание 6 будем называть детерминированнымі 
т. е. однозначно определенным. С другой стороны, при повто- 
рении комплекса условий у мы можем в разных реализациях 
получать различные элементарные исходы о: иногда — эле- 
ментарный исход о}, иногда — фо и т. д.; такое испытание 6! 
будем называть недетерминированным. | 

Недетерминированное испытание часто называют случай- 
ным испытанием (все приведенные выше примеры — это при: 
меры случайных испытаний). Предварительно мы также вос 
пользуемся этой терминологией, отложив на дальнейшее бо- 
лее строгое определение понятия случайности. Здесь лишь от- 
метим два смысловых оттенка, связанных со словом «случай»д 
Во-первых, случайность может означать непредсказуемосты 
того или иного явления. Этот смысловой оттенок используется] 
когда мы говорим, что, зная комплекс условий ‘у случайного 
испытания 6, нельзя одпозначно предсказать элементарный. 
исход о; в какой-то конкретной реализации. Во-вторых, — и 
такой смысловой оттенок нам представляется главпым в рам- 
ках рассматриваемых далее математических схем — случай- 
ность испытания 6 указывает просто на то, что при одном и 
том же комплексе условий в разных реализациях возможны: 
разные случаи, приводящие к различным элементарным 
исходам о). Другими словами, в комплекс условий у не вхо- 
дит ряд характеристик, воздействующих на исход конкретного: 
испытания. | 

Нередко можпо указать мпожество О--іө) всех воз- 
можных элементарных исходов случайного испытания. Такая 
ситуация имеет место в примерах І-І, І-2 и 1-3. В примере 1-4 
диапазон допустимых значений признака может быть выбран 
достаточно широким, чтобы наверняка включить в себя зна- 
чение роста любого призывника, тогда указанный числовой 
диапазон будет служить в качестве множества элементарных 
исходов Q. Приведем еще несколько примеров. 

Пример 1-5. Наблюдение пола новорожденного есть слу- 
чайпое испытание с двумя возможными элементарными исхо- 
дами: о; — родился мальчик, ог — родилась девочка. 

Пример 1-6. Измерение диаметра колонии дрожжей в чаш- 
ке Петри может дать любое числовое значение, заключенное 
между нулем и величиной диаметра самой чашки. В этом слу- 
чае множество элементарных исходов есть отрезок числовой 
оси Q= [0, d], где 4 — диаметр чашки Петри. 

Пример 1-7. Определяется процент насекомых, погибших от 


| 
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воздействия некоторой дозы ядохимиката. Хотя от опыта к 
опыту этот показатель может варьировать, очевидно, что мно- 
жество возможных элементарных исходов такого случайного 
испытания есть множество действительных чисел, заключенных 
между 0 и 100. 

В дальнейшем мы будем предполагать, что всегда выпол- 
няется описанное требование полной определенно- 
сти множества элементарных исходов Q= (0) |. 

Многие биологические явления, описываемые при помощи 
понятия случайного испытания, допускают представление в 
виде простых и наглядных моделей, которые в дальнейшем мы 
будем называть модель «урна» и модель «мишень». 

Модель «урна». В урне находятся неразличимые на ощупь 
шары. Каждый шар имеет свой цвет (или какой-то другой 
отличительный признак). Имеется п, шаров первого цвета, 
по — второго, ..., й, — г-го цвета; всего в урне n=n +...+ 
+n, шаров. Случайное испытание состоит в выборе наугад 
шара из урны с регистрацией в качестве исхода цвета шара. 
Если выбирается каждый раз по одному шару, то исход та- 
кого случайного испытания можно представить множеством 
элементарных исходов © ={0, ®2,..., 0), каждый элемент 
о: которого соответствует вытаскиванию из урны шара 1-го 
цвета. Модель «урна» допускает и другие правила извлечения 
шаров, что делает ее весьма гибким инструментом интерпре- 
тации теоретико-вероятностных понятий (см. задачу 1-7). 

Модель «мишень». Имеется плоская мишень — квадрат еди- 
иичной площади, левый пижний угол которого расположени в 
начале координат, а стороны совпадают 
с лучами, ограничивающими первый у 
квадрант (рис. 1). В мишень бросается 1 
«точка»; т. е. обьект, размерами которо- валс) | 
го можно пренебречь. Исходом испыта- йы 


Рис. 1. Модель «мишень». 
Элементарными исходами случайного испытания яв- к 


ляются все точки единичного квадрата ®. Каждый эле- 0 
ментарный исход представляет собой точку с координа- 
тами (x, y): D Ср У, Со Оу 1. 


ния является попадание точки в одну из точек квадранта. Га- 
ким образом, элементарный исход такого испытания представ- 
ляет собой точку квадрата с координатами о; = (Xt, Yi), где 
О<х«<1 и О <и < 1, а само мпожество элементарных HC- 
ходов Q совпадает с этим квадратом. Модель «мишень» MO- 
жет иметь несколько модификаций, например множество 9 мо- 
жет быть`не квадратом, а произвольной частью плоскости, ча- 
стью прямой линии, частью трехмерного пространства и т. д. 

До сих пор мы описывали случайные испытания языком, 
«естественным» для исследователя, работающего в той или 
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иной конкретной области. Этот язык обладает несомненными 
достоинствами наглядности и общедоступности. Однако на- 
званные достоинства затрудняют его использование при по- 
строении строгих математических схем. Поэтому, по крайней 
мере на время, мы должны пожертвовать паглядностью и 06- 
ратиться к более формальному языку математики. Вспомним 
вначале элементы теории множеств, которые мы уже «неза- 
метпо» привлекали в ходе предшествующего изложения. 


$ 2. ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ 


Исходное «универсальное» множество, с которым «работа- 
ют» в теории вероятностей, есть совокупность (2 элементар- 
пых исходов 1, Что обозначается при помощи записи Q= 
= {©:}. Тот факт, что элементарный исход о; является эле- 
ментом множества 0, записывается как EQ. 


Используя только часть элементов множества Q, можно 00- 
разовывать другие, отличные от 0, множества. Множество А 
будет считаться определенным, если для любого элемента 
«ЕО можно сказать, припадлежит элемент о множеству А 
(ов-А) или элемент о не принадлежит множеству А. Случай 
непринадлежности элемента о множеству А будем обозначать 


оЕЕД. 

Пример 1-8. При бросании игральной кости универсальным 
множеством © = {0}, ..., ов} является множество, состоящее 
из чисел 1, 2, ..., 6. Подмножеством этого множества будет, 
например, множество А = {2, 4, 6}, соответствующее тому, что 
в результате случайного испытания выпало четное число оч- 
ков. Здесь мпожество А определено прямым перечислением 
входящих в него элементов: 2ЕА, 4еА, бе: А. Остальные эле- 
менты не принадлежат ДА: 1Е А, Зе-А, 5 А. 

Если множества Q и А бесконечны, множество А нельзя 
задать прямым перечислением элементов. Тогда А считается 
заданным, если указано свойство элементов «ЕО, делающее 
их элементами множества А. 


Пример 1-9. Отрезок A= [0, 1], состоящий из бесконечного 
числа точек, определен как мпожество указанием, что он со- 
держит все действительные числа, обладающие свойством 
0<<- о:<< 1. Здесь роль Q выполняет множество всех действи- 
тельных чисел. И для любого о:Є9 мы можем указать, при- 
надлежит ли этот элемент множеству А = [0,1], проверив для 
этого элемента выполнение указанного неравенства. 

Если каждый элемент множества А является элементом 
мпожества В, то это соотношение условно записывается 
ASB и читается «множество А содержится в множестве В» 
или «мпожество А есть подмножество множества В». Очевид- 
но выполнение следующих свойств отношения Œ, которые де- 
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лают его очень похожим на отношение обычного неравенства 
для чисел: 1) для любого множества А имеет место ASA; 
2) если ASB и BSA, то А = В; 3) если ASB и B&C, то 
Д< С. Запись А--С означает, что все элементы множеств А и 
В совпадают. В ситуации, когда ASB и А5 В, используется 
обозначение Ас В. 

Пример 1-10. При подбрасъвании игральной кости множе- 
ство четных чисел А-- (2, 4, 6} есть подмножество множеств 
В,={1, 2, 3, 4, 5, 6} и В. = (2, 3, 4, 6}. При этом можпо BH- 
деть, что 4< В), Ву В, и А-В). 

Для любого множества А имеет место соотношение ASQ, 
т. е. все паши множества суть подмножества универсального 
множества Q. Введем особое мпожество, обозначаемое далее 
знаком ©), которое обладает противоположным сравнительно 
с множеством 9 свойством: для всех множеств А имеет место 
соотношение OSEA. Поскольку множество 2, обладающее Ta- 
ким свойством, не может содержать ни одного элемента, по- 
стольку множество ©) получает наименование пустого множе- 
ства. Заметим, что любое множество А «заключено» между 
пустым множеством © и универсальным множеством Q в 
смысле выполнения соотношения @=А=о. 

Пример 1-11. Элементарные исходы при бросании монеты 
суть о — «герб» и ог — «решка», а универсальное множест- 
во О--(01, ог}. Перечислим все подмножества множества 
О: ©, {о}, {02} и О--(о), о). Здесь (оз) — множество, CO- 
стоящее из единственного элемента OEN. 

Необходимо различать элемент о; и одноэлементное MHO- 
жество {wi}, так как они обладают совершенно разными TEO- 
ретико-множествепными свойствами и по-разному относятся 
к универсальному множеству Q: о; принадлежит © как эле- 
мент, что записывается как о:Є9; (он) входит в Q как NON- 
множество, что записывается {0} EO. 


По аналогии с функцией многих переменных y=f(x, 
Ха) в теории множеств вводятся операции В--/ (А, ..., 
А»), ставящие в соответствие множествам д}, ..., А, множе- 
ство В. 


Важной операцией является взятие дополнения А множе- 


ства А до всего множества Q. Дополнение А множества А есть 
мпожество, состоящее из всех элементов О, не входящих в мно- 
жество А. қ 

Пример 1-12. При бросанип игральной кости дополнением 
миожества А--(2, 4, 6} будет мпожество В=А = (1, 3, 5}, 
что соответствует выпадению нечетного числа очков. 

Вводятся операция объединения множеств А, и А», обо- 
значаемая B=A UA: и операция пересечения множеств А, 
и А», обозначаемая В = 4,4. Объединение В-А(Ц)А; mno- 
жеств А, и А. есть множество, состоящее из всех тех элемен- 
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тов мпожества О, которые входят по крайней мере в одно из 
множеств А, или А». Пересечение В=А А. множеств А и A2 
есть множество, состоящее из всех тех элементов множества 
О, которые одновременно входят в множество А; и в множе- 


ство До. 

Пример 1-13. При бросании игральной кости объединением 
мпожеств А, = {2, 4} и А.={4, 6} будет уже знакомое пам 
множество В=Ац]А2== (2, 4, 6}, соответствующее выпадению 
четного числа очков, а пересечением этих множеств будет 
однозлементное мпожество В=А А. = (4), состоящее из од- 
ного элемеитарного исхода 4=0. 

Операции объединения и пересечения множеств естествен- 
но обобщаются на случай любого числа множеств: В-- А ЈА зу 
.. Ап)... и В-- А NAN. ..NAnN. .. . Если число множеств KO- 
кечно и равно п, то их объединепие (пересечение) обознача- 
ется 714: (NZ; А4); аналогично записывается объединение 


(пересечение) бесконечного числа множеств: |? А; (ПӘ, А;); 
когда объединяться (пересекаться) может как конечпое число 
множеств, так и бесконечное, тогда мы будем использовать 
обозначение UiA: (NA) я 

В теории множеств объчно рассматриваются не изолирован- 
ные множества, а их совокупности, в которых отдельные мно- 
жества связаны между собой определениыми операциями и со- 
отношениями. Среди таких совокуппостей особый интерес для 
теории вероятностей представляет так называемая алгебра 
множеств. Совокупность множеств Æ называют алгеброй, если 
для нее выполнены следующие условия: 

1) Фе Æ (принадлежность множества алгебре обознача- 
ется тем же символом, что и принадлежность элемента мно- 
жеству); 

2) Әде ж; 

3) если А, Ве Æ, тои AUBE Æ ; 

4) если А, Ве 5%, то и АПВе-.%; 

5) если AE Æ , тои Ає %. 

Иными словами, алгебра .% «замкнута» относительно опе- 
раций объединения, пересечения и взятия дополнений MHO- 
жеств. Математик сказал бы, что это не просто алгебра, а 
сигма-алгебра, так как замкнутость Æ имеет место для бес- 
конечных пересечений и объединений. Но мы позволим 
себе небольшую неточность, чтобы не делать терминологию 
слишком громоздкой. 


$ 3. СЛУЧАЙНОЕ СОБЫТИЕ 


Одним из важнейших понятий теории вероятностей явля- 
ется понятие случайного события. Теперь, используя резуль- 
таты двух предыдущих параграфов, мы можем его опреде- 
Лить. 
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Выше мы ввели О — {1} — универсальное множество эле- 
моптарных исходов случайного испытания 6, рассмотрели 
подмножество ASQ и задгзи алгебру 5. Случайное собы- 
тие Л есть такое подмножество А множества элементарных 
исходов Q, которое одновременио является элементом алгеб- 
ры 52. В связи с этим определением алгебру Æ в теории Bepo- 
стпостей называют алгеброй случайных событий. 

Пример 1-14. Рассмотрим множество элементарных исходов 
случайного испътапия, состояшего в бросании монеты Q= 
= {on 02). Множество всех подмножеств мпожества Q 
естествегпо замкнуто относительно теоретико-мпожественных 
операций: 


1) 2-6, lo} = {w}, (oal 09у, Qee 
2) ØU {o} = 191], 22 019; ‚| = (02), 209 = 9, е Ufa] 0 
Гы ео. о: 
3) ЯП! = ФР B Nlo! E о. о 105) = @, 
\ , 
Фо ПО = (9), 19 NES (9. |. 


Следовательно, множество всех лодмножеств множества 
элементарных исходов О явллется алгеброй случайных собы- 
тий Æ. Поэтому подмножества Ø, (ө1), {0}, © = (о), о2} суть 
случайные события. Однако множество всех подмножеств (2 OT- 
пюдь ис единственпая система, сбразующея алгебру Æ. 

Пример 1-15. Рассмотрим множество элементарных исходов 
случайного испытания, состоящего в бросании игральной кос- 
ти: Ө--іоі, .. 06). Предложим в качестве случайных собы- 
тий следующую совокупность подмножеств множества ©: Ø, 
А= {1, 3, 5}, В={2, 4, 6}, Q. С-помощью прямого перечисле- 
ния, как это было сделано в предыдущем примере, нетрудно 
убедиться в замкнутости данной совокупности относительно 
операций объединения, пересечения и дополнения множеств, 
т. е. она образует алгебру Æ, и, следовательно, ©, А, В, Q 
можно рассматривать в качестве случайных событий. Такая 
совокупность случайных событий является естественной мате- 
матической моделью случайного испытания, когда нас интере- 
сует лишь выпадение четного или нечетного числа очков. 

Пример 1-16. При определении содержания ДДТ в траве 
для установления пригодности поля в качестве пастбища важ- 
по не само измеренное значение, а ответ на вопрос: превыша- 
ет ли оно допустимый санитарный уровень С? Иными слова- 
ми, интерес представляет пе какой-то элементарный исход 
Год, но случайное событие {о; < С). 

Таким образом, необязательное совпадение совокупности 
(алгебры) случайных событий 4% с множеством всех подмно- 
жеств Q дает в руки исслелователя гибкий аппарат описания 
исходов случайного испытания, позволяющий приспосабливать 
этот аппарат к решению конкретных задач. 
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Введем следующий принцип осуществления событий: слу- 
чайное событие ASQ происходит тогда и только тогда, 
когда при случайном испытании имеет место элементарный 
исход ох, входящий в миожество А, т. е. а ЕА (рис. 2,а). 
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Рис. 2. Случайные события и операции пад ними. 


а — событис, состоящее в попадании в множество А, осуществляется тогда им 
только тогда, когда элементарный исход о случайного испытания есть элемент 


множества А: oy Є А. 


6 — событис, состоящее в попаданни в множество А (в незаштрихованную часть 
множсства % ), происходит тогда и только тогда, когда не происходит событие А, 
состоящее в попадании в множество А; 

в — событие, состоящее в попаданнн в множество В = А, U А. (в незаштрихован- 
ную часть множества Q), происходит тогда и только тогда, когда или происходит CO- 
бытие, состоящее в попадании в множество А: (исход 1), или событие, состоящее в 
нопадании в множество Аз (исход w2), или событие, состоящее в попаданин в 
множество А, и в множество А» (исход Ca); 

г — событие, состоящее в попадании в множество В = 4, ПА, (в незаштрихо- 
ванную часть множества 9 ), происходит тогда и только тогда, когда одновременно 
происходят событие, состоящее в попадании в множество А,, и событие, состоящее 
в попадании в множество А» (исход Фр); 

д — из осуществления события, состоящего в попадании в множество А (ис- 
ход ws), следует осуществление события, состоящего в попадании в множество В, 


содержащее множество А: АФ В. 


Про элементарные исходы, входящие в множество А, говорят, 
что они благоприятствуют событию А. 

Заметим, что каждому элементарному исходу о:6Е MOX- 
но сопоставить событие А;=®, представляющее собой одно- 
элементное множество А; : (өз) EQ. Такие одноэлементные CNY- 
чайные события пазывают элементарными случайными собы- 
тиями. Таким образом, мы получаем возможность интерпре- 


тировать элементарпые исходы о ЕО как элементарные собы- 
тия (оф<0. 


20 


Опишем теперь в теоретико-вероятностных термипах опе- 
рации над событиями. 

Случайное событие В-- Д происходит тогда и только тогда, 
когда не происходит событие А (рис. 2,6). 

Случайное событие В-- АА,» происходит тогда и только 
тогда, когда происходит одно из событий А и А. или оба они 
происходят вместе (рис. 2, в). Аналогично случайное событие 
В = А, происходит тогда и только тогда, когда происходит 
по крайней мере одно из событий Ді, ..., А,,.... 

Случайное событие В-- АПА» происходит тогда и только 
тогда, когда происходят одновременно события А) и А, 
(рис. 2, г). Аналогично событие В==[:А; происходит тогда и 
только тогда, когда все события А}, ..., Аһ, ... происходят COB- 
местно. 

Если АДА. = Ф, то эти события называются несовместны- 


ми. Например, событие А и его дополнение А несовместны. 

Если произошло событие А и имеет место соотношение 
ASB, то произошло и событие В (рис. 2,0). Поэтому, когда 
имеет место соотношение ASB, мы будем говорить, что собы- 
тие А влечет событие В. Понятно, что событие О сле- 
дует из любого элементарного события (о:), которое происхо- 
дит при появлении элементарного исхода ®;. Иными словами, 
событие Q осуществляется при любом исходе случайного испы- 
тания и может быть названо достоверным событием. Событие 
Ю не следует ни из одного элементарного события, т. е. не 
осуществляется ни при каком исходе случайного испытания. 
Это позволяет пазвать событие (2) невозможным событием. 


$ 4. ЧАСТОТА СЛУЧАЙНОГО СОБЫТИЯ 


Случайное испытание 6 повторим п раз (61, 62, ..., бл). 
регистрируя каждый раз наступление некоторого случайного 
события А из алгебры событий .%. Величина Л(А; п; 6. 
.. Өт), равная частному от деления числа испытаний MA, 
в которых произошло событие А, на общее число испытаний 
п, пазывается относительной частотой, или просто частотой, 
события А в данной серии из п реализаций случайного испы- 
тания 6. Для простоты обозначение В(А; п; 6r .... бл) 
мы будем заменять на h (А; п). 

Очевидны следующие свойства частоты, верные для лю- 
бой серии испытаний (см. также задачу 1-4): 

1. Для любого события Ая Æ имеет место неравепство 
0—1 (А; п) < 1. 

2. Если А=0, то А(А; п) =1. Однако обратное неверно: 
если частота А(А; п) =1, это не означает, что А есть собы- 
тне достоверное. 

З. Если А--О, то А(А; п) =0. Обратное неверно: если ча- 
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стота №(А; п) =0, то это пе означает, что А — невозможное 
событие. 
4. Если любые два события А, А; из группы событий А, 
., А, попарно несовместны (АПА) = Ф, 1==], то 


h ( МЕЛ A; я) = D (Аг; п). 


Повторяя серни из п испытаний, мы будем получать в раз- 
ных сериях, вообще гогоря, разныс частоты события А. В са- 
мом деле, кого удивит, что в одной серии из трех бросаний 
монеты «герб» выпадает два раза, а в другой — один раз? 
Частота события А, состоящего в выпадении «герба», в пер- 
вой серин будет равна #1, (А; 3) =?/., а во второй — #2(4; 3) = 
—='!/з. Однако дия достаточно обширного класса случайных 
испытаний частоты событий при увеличении длины серии име- 
ют тенденцию стабилизироваться около определеп- 
ного числового значения А(А) и тем самым становиться He- 
зависимыми от конкретной серии испытаний. Таким образом, 
частота события А становится характеристикой самого слу- 
чайного события А Œ Æ безотносительно к конкретной pea- 
лизации случайного испытания 6. Случайное испытание, CO- 
стоящее в бросании монеты, — это типичный пример стабили- 
зации частот: для «правильной» монеты неоднократно уста- 
навливалось, что в длинных сериях частота появления «гер- 
ба» мало отличается от 14/5. 

Так, например, Ж. Бюффон в 1777 г. получил h (А; 4040) = 
= (0,5069; А. де Морган (начало ХІХ в.) — 2 (А; 4092) --0,5005; 
У. Джевонс (1887 г.) — Ё; (А; 10 240) =0,5036 и л, (А; 10 240) = 
<< 0,5100; В. И. Романовский (1912 г.) — (А; 80640) =0,4923; 
К. Пирсон (1926 г.) — h, (А; 12000) = 0,5016 и № (А; 24 000) = 
= 0,5005; Дж. Керрих (1946 г.) — h (А; 10000) = 0,5067 (см. 
также рис. 3). 

Подобными «генераторами» стабильности частот являются 
бросанчс игральпой кости, вращение рулетки и т. п. 

Многие биологические процессы сопровождаются стабили- 
зацией частот некоторых событий: довольно стабильны часто- 
та появления новорожденных определенного пола, частота 
различных заболеваний, частота вступления в брак в разных 
возрастных категориях, частота появления определенных гено- 
типов в определенных скрещиваниях и т. п. Физические про- 
цессы также служат обильным источником примеров генерато- 
ров стабильных частот: попадания космических частиц в счет- 
чик Гейгера — Мюллера; появления флуктуаций заданной Be- 
личипы во всех процессах, изучаемых статистической физи- 
кой; попадания капель дождя на некоторую поверхпость 
ят. д. 

Выбранные нами модели случайных испытаний: модель 
«урна» и модель «мишень» — одновременно могут служить и 
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гепсраторами стабильных частот. Многочисленные экспери- 
менты, состоящие в извлечении (наугад, с последующим воз- 
вращением и тщательным перемешиванием) шара из урны, 
показывают, что частота появления шаров данного цвета 
устойчива и колеблется около числа, равного доле шаров это- 
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Рис. 3. Результаты трех серий экспериментов с монетой (по 1000 бросаний 
в каждой серии). 
h (А; п) — частота выпадения «герба». 


го цвета в урне. Например, А. Кетле (1846 г.) вынимал 
4096 раз с возвращением шар из урны, содержащей 20 белых 
и 20 черных шаров, и получил #(А; 4096) = 0,5044. Если же 
наугад бросать точку в мишень, то частота попадания точки 
в какую-либо часть мишени стабилизируется около величины, 
пропорциональной площади этой части. Проведите экспери- 
мент: выставьте песколько раз на моросящий дождик пло- 
скую фанеру с очерченной па ней произвольной фигурой и 
подсчитайте частоту попаданий дождинок в эту фигуру. Mox- 
дик должен быть слабым, а экспозиция — недолгой, чтобы сле- 
ды от капелек ·не сливались. Практическая работа статистика 
(в частности, биометрика) требует простого и доступного 
генератора стабильных частот; эту роль играет таблица слу- 
чайных чисел (табл. [ Приложения, см. гл. ТУ, $ 3). 

Об эмпирической стабилизации частоты события А мы бу- 
дем говорить только в случае выполнения следующих требо- 
ваний: 

1. Проведено достаточно много достаточно 


длинных серий реализаций испытания 6. 
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2. Среди всех серий реализаций случайного испытания 6 
доля тех серий, в которых частота #(А; п) события А отлн- 
чается от числа һ(А) больше, чем на некоторое достаточ- 
но малое число #>0, пренебрежимо мала. 

Далее, говоря о случайных испытаниях, мы всегда будем 
предполагать стабильпость частот всех событий, входящих в 
алгебру случайных событий Æ. 

В приведенном описании стабилизации частоты события А 
специально подчеркнута неопределенпость: «достаточно мно- 
го» серий, «достаточная длина» серии, «достаточно малое число 
=>0», «пренебрежимо малая» доля. В каждой конкретной coe- 
ре исследования указапная неопределенность получает свою 
количественную оценку исходя из специфики требований к точ- 
ности исследования и из возможности исследователя. 

В заключение параграфа резюмируем все ограничения, ко- 
торые были наложены на употребление слов «случайное ис- 
пытание 6»: 1) в случайном испытании определено множество 
элементарных исходов Q; 2) зафиксирована алгебра случайных 
событий Æ, состоящая из подмножеств множества ©; 3) для 
каждого случайного события А из алгебры случайных собы- 
тий Æ определепа стабильная частота А(А), зависящая толь- 
ко от самого испытания 6 и от события А, но не от конкрет- 
ной серии реализаций случайного испытания 6. Тем самым 
из очень широкого класса недетерминированных испытаний 
выделена сравнительно узкая область явлений, которые мыи 
называем случайным испытапием. 


$ 5. ВЕРОЯТНОСТЬ СЛУЧАЙНОГО СОБЫТИЯ 


Развивая представления о случайных испытаниях, мы на- 
чали с обсуждения некоторых экспериментальных схем и вве- 
ли понятие множества элементарных исходов 9 (6 1). Необ- 
ходимость обобщения этих представлений потребовала прибег- 
нуть к аппарату теории множеств ($ 2) и ввести понятие 
алгебры Æ и случайного события А (6 3). В рамках конкрет- 
ных экспериментальных ситуаций мы рассмотрели затем важ- 
нейшую характеристику случайного испытания — частоту слу- 
чайного события #(А) ($ 4). Теперь необходим следующий 
этап построения математического аппарата: на смену понятию 
частоты мы должны ввести строго определенное аксиома- 
тическое понятие вероятности случайного события Р(А). 
При этом понятие и свойства вероятности естественно форму- 
лировать таким образом, чтобы они практически совпадали с 
понятием и свойством частоты, т. е. были бы приложимы к 
анализу широкого класса экспериментов. Введем аксиоматику 
теории вероятностей, предложенную замечательным отечест- 
вепным математиком А. Н. Колмогоровым в 1933 г. 
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Вероятностью случайного события А называется функция 
P(A), заданная на алгебре случайных событий сў и обладаю- 
шая следующими свойствами: 

Аксиома 1. Вероятность любого случайного события есть 
пеотрицательное число: P(A) 2>0. 

Аксиома 2. Вероятность достоверного события равна еди- 
нице: Р(О) =1. 

Аксиома 3. Если события А, ... Aks, ... попарно несов- 
местны: АДА; = ©, ізгі, то вероятность объединения этих CO- 
бытий равпа сумме их вероятностей: 


P (U: A) =X; P(A). 


Тройка математических объектов (Q, Æ, P), сопоставляе- 
мых случайному испытанию (6, называется вероятностным 
пространством. Теперь, с появлением понятия вероятностного 
пространства, можно приступить к построению теории ве- 
роятностей: вероятностное пространство (©, Æ, Р) есть 
математический образ реального случайного испытания 6 и 
далее будет отождествляться с этим испытанием. 

Еще раз подчеркнем, что математическая схема (О, Æ, 
P) извлекает из реального случайного эксперимента ( лишь 
наличие множества возможных исходов и стабильных частот, 
оставляя за своими рамками «непредсказуемость» исхода кон- 
кретной реализации случайного испытания. 

Рассмотрим простейшие следствия из принятых аксиом. 

1. Вероятность Р(А) — дополнительного события А к со- 
бытию А — определяется формулой 


Р(А)=1— P(A). 
Доказательство. Рассмотрим некоторое событие AEA. 

Из замкнутости Æ относительно операции взятия дополнения 
следует, что Ає#. Поскольку А, ДЕ, то по замкнуто- 
сти 94 относительно объединения имеем А(ЈАє.9#. Следова- 
тельно, определены вероятности событий P(A), P(A), 
Р(АЏА). Так как АПА = Ø (см. $ 3), то по аксноме 3 
Р(АЦА) -Р(А) + Р(А). Однако АЦА=О и Р(9) =1. Сле- 
довательно, l= P (A) +Р(А), откуда имеем искомый р 

2. Вероятность невозможного события равна нулю: Р(@) = 

З. Если А< В, то Р(А) <Р(В). 

4. Вероятность любого события заключена между нулем и 
единицей: 0<< Р(А) << |. 

5. Для любых событий А и В имеет место соотношение 


Р(АЏВ) = Р(А)4- Р(В)—Р(АПВ). 


Проведем подробное доказательство этой важной форму- 
Очевидны два следующих соотношения: АЈВ= ВЈ (АПВ), 
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А = (АПВ) Ц (АПВ), в которых правые части имеют вид 
объединения несовместных событий. Несовместность событий 
в правых частях позволяет применить к обоим соотпошениям 
аксиому 3, что дает два уравнения: Р(АЦВ) = P(B) + 
+Р(АПВ) и P(A) = Р(АПВ) + Р(АПВ). Вычитая из nep- 
вого уравнения второе и приводя подобные члены, получим 
искомую формулу, которая носит название формулы сложе- 
ния вероятностей. 


$ 6. УСЛОВНАЯ ВЕРОЯТНОСТЬ И НЕЗАВИСИМОСТЬ СОБЫТИЙ 


Пусть (Q, Æ, Р) — вероятностиое пространство, описы- 
вающее случайпое испытание 6. Выберем из алгебры событий 
54 некоторое событие В, имеющее ненулевую вероятность: 
Р(В)>0. Рассмотрим функцию Р(А/В), определенную для 
любого события Дет S соотношением 


Р(АпВ 
Р(А/В) = 51. 


Можно показать, что Р(А/В) удовлетворяет аксиомам теории 
вероятностей, т. с. является вероятностью (задача 1-5). 

Выяспим содержательный смысл новой вероятности 

Р(А/В), полученной пока формальным пу- 

цу о тем. Обратимся с этой целью к модели «мн- 

шень» (рис. 4) и предположим, что произо- 

шло событие В, т. е. наугад брошенная точ- 


Рис. 4. Вероятность попадания наугад брошенной 

точки в множество А, когда известно, что эта 

точка попала в мпожество В, равна отношению 

площади А’=АПВ к площади 9”--В. Эта Bepo- 

0 и ятность и есть условная вероятность Р(А/В) co- 
бытия А при реализации события В. 


ка попала в множество В. Как влияет реализация события В на 
вероятность появления события А? Когда событие В имеет с co- 
бытием А непустое пересечение (АП В == 9) и одновременно He- 
полностью содержится в А (BAA), тогда появление собы- 
тия В не определяет однозначно реализацию события Д: если 
элементарным исходом испытания была точка о Е АПВ, то 
событие А произошло, а если таким исходом была точка (: е: 
Е АПВ, то событие А не произошло. Информация о появлении 
события В сужает множество возможных элементарных исходов 
случайного испытапия — вместо множества Q теперь достовер- 
ным событием выступает множество Q’ = В. 

Аналогично отсекаются элементарные исходы, припадлежа- 


щие множеству АПВ, и теперь событию А благоприятствуют 
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не все элементарныс исходы, составляющие А, а лишь те, ко- 
торые входят в пересечение А’=АПВ. Поскольку в модели 
«мишень» устойчивость частоты событий, а следовательно, н 
их вероятности определяются долей площади 5(А) соответ- 
ствующего множества А от площади 5(0) всего множества 
элементарных исходов, то появление события В изменяет ве- 
роятность Р(А)=5(А)/5(®) на новую величину Р'(А) = 
=S (А!)/5 (Q) --5 (АПВ)/5 (В). Поделив числитель и знамена- 
тель последней дроби па 5(0), получаем для вероятности NO- 
явления события А при условии реализации события В выра- 
жение Р (А) = Р(АПВ)/Р (В). 

ПНриведениые выше соображения позволяют, таким обра- 
зом, интерпретировать Р(А/В) как условную вероятность со- 
бытия А при реализации В. Из определения условной вероят- 
пости сразу же следует формула умножения вероятностей: 


Р(АПВ) = P(A / B)-P (B). 


Не нужио забывать, что формула умножения вероятностей 
определена лишь тогда, когда Р(В)>0. 
Из полученной формулы следует также, что 


Р(АПВ)--Р(В /А)-Р(А) 


при условии, что P(A) > 0. 

Пусть Р(А)>0, Р(В) >0. Будем говорить, что вероятность 
события В не зависит от реализации события А, если услов- 
ная вероятность события А при реализации события В сов- 
падает с «безусловной» вероятностью события А: Р(А/В) = 
= P(A). Нетрудно показать, что в таком случае верпо и соот- 
ношение Р(В/А)--Р(В), т. е. и вероятность события В неза- 
висит от реализации события А. Поэтому мы будем называть 
А и В независимыми, если выполнены эти соотношения, зкви- 
валентпые сотношению 


P:AN B) = P(A) - P(B). 


Заметим, что независимость и несовместиость событий 
А, В, имеющих положительную вероятность, являются песов- 
местимыми попятиями. Допустим противное, полагая события 
А, В одновременно несовместными (АПВ = Ø) и независи- 
мыми. Одпако тогда получаем соотношение P(O) = P(A). 
.Р(В), которое ложно, так как левая его часть равна нулю, а 
правая — строго больше нуля. Полученное противоречие и до- 
казывает исходное утверждение. 

Понятие независимости можно сформулировать и для груп- 
пы событий Д), ..., Аһ, но здесь условие независимости может 
быть модифицировано различными способами, что дает раз- 
ные виды независимости, три из которых мы рассмотрим. 

1. События А, ..., А, называются попарно независимыми, 
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если любые два события А; А, {==}, независимы, т. е. если 
для любых А; А,, (£j, выполнено соотношение 


РА П А) = Р(А,) - P(A). 


2. События А, ..., А, называются совместно независи- 
мыми, если выполнено соотношение 


P (п А) = ПП” РСА). 


З. События А}, .... Ая называются независимыми в сово- 
купности, если для любого набора различных индексов і, 
2. п, Іі-п, 2<Е<сп, имеет место соотношение 

k 
P (Nfa Ai) = П., Р(А,,) ° 

Другими словами, независимость в совокупности означает He- 
зависимость двоек событий (попарную независимость), троек, 
четверок и т. д. до п событий. = 

Совместная и попарная независимости не следуют друг из 

друга и пе влекут независимости в совокупности. Это утверж- 
дение доказывается следующими двумя примерами. 

Пример 1-17. Имеется вероятностное пространство (Q, £, 
Р), где множество элементарных 
исходов состоит из четырех эле- 
ментов: © = (о), 9, өз, 04} (рис. 
5). Каждому элементарному со- 
бытию (оі) приписывается оди- 
наковая вероятность Р({о;}) = 


\®/ = 1/4. Рассмотрим события А, = 
= (0, 04), Аз = (02, 04}, Аз = 


Рис. 5. События АЯ), Аз, Аз попарно we- 

зависимы, но не являются ни совмест- 

но независимыми, ни независимыми в со- 
вокупности (пример 1-17). 


= (Өз, 04), взятые из алгебры событий Æ, включающей в себя 
все подмножества Q (см. рис. 5). 

Используя аксиому 3, получаем вероятности P(A)= 
--Р(4;) = Р(Аз) =!).. Очевидны следующие соотношения: 
Р(А ПА») =1/4=Р(А,) -P (A2), Р(А Паз) = 1/4=Р(А.) “Р(43), 
Р(А:ПАз) = 1/4==Р(А,) ·Р(Аз), показывающие наличие попар- 
ной независимости событий А,, Аг, Аз. Одновременно имеет место 
соотношение P (ANANA) =P ({04)) =1/4ÆP (A1) -P (A2) - Р(Аз), 
указывающее на отсутствие совместной независимости и неза- 
висимости в совокупности. Итак, попарная независимость не 
влечет пи пезависимости в совокупности, ни совместной незави- 
CHMOCTH. 

Пример 1-18. Аналогично предыдущему примеру рассмотрим 
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вероятностное пространство (Q, Æ, Р): Ә--іо, .. өв}, 
Р((о:)) --1/8, Аі--(өі, Өз, Өз, ов), A:={03, 04, 05, Өз), Аз= 
== ((05, (06, 07, 08) (рис. 6). 

Имеем P (A1) =P (A2) =P (A3) =1/2; Р(АПА:ПАз) = Р((ов)) = 
—1/8=Р(А!) - P (A2) -Р (Аз), следовательно, события Ai, А,, Аҙ 
совместно независимы. Ho Р(А! [| 


П Аз) = P(fos}) = 1/8-+ РА). 


.Р(Аз), что указывает на отсут- 

ствие попарной независимости и 

независимости в совокупности. 

Итак, совместная пезависимость 2, % 
> 


не влечет ни независимости В со- 
вокупности ни попарной незави- 
СИМОСТИ. 


ИН ВЕНЕ ОИ нет екн 

Рис. 6. События А, А», А. совместно 

независимы, но не являются независи- 

мыми ни в совокупности, ни попарно 
(пример 1-18). 


Поясним выявленные связи между видами исзависимости на 
примере трех событий А, В, С. Их совместиая независимость эк- 
вивалентна выполнению соотношепия НС, попарная независи- 
мость — соотношений НП, а независимость в совокупности 
(НВС) — выполнению всех этих соотношений одновременно: 


P(A N ВПС) = P(A): Р(В)- P(C) — HC 
P(A N B)=P (A) - Р(В)| 

НВС P(A N C)=P (А) - P(C) -НП 
P(B N C)=P (B) -Р(С)] 


Для решения задач полезно знать о легко показываемой зкви- 
валентности следующих четырех утверждепий: 1) события А, В 


независимы; 2) события А, В независимы; 3) события А, В неза- 
висимы; 4) события А, В независимы. 


$ 7. КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 


Математическая модель (Q, Æ, Р) случайного испытания 6 
носит довольно общий и абстрактный характер: множество эле- 
ментарных исходов может быть произвольным множеством с эле- 
ментами любой природы; нет никаких содержательных ограниче- 
ний на задание алгебры .% и не конкретизирован способ зада- 
ния вероятности Р. Однако зачастую мы обладаем дополни- 
тельной информацией, позволяющей конкретизировать абст- 
рактные объекты ©, Æ, P. С этой точки зрения рассмотрим два 
подхода к определению понятия вероятности, исторически пред- 
шествовавших аксиоматическому определению. 

Возникшее в ХУП в. в работах П. Ферма, Б. Паскаля, 
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Х. Гюйгенса и Я. Бернулли классическое определение вероят- 
пости получается как частный случай аксиоматического, когда 
введены два ограпичения: 1) множество элементарных исхо- 


дов Q копсчно: Q = {œi ..., ©}; 2) все элементарные собы- 
тия {0}, ..., (да) равновероятны: Р((өі) = Р (ол). Алгебра 


53$ совпадает с мпожеством всех подмножеств множества ©. 
Тогда вероятность любого случайного события Д, состоящего 
из элементарных исходов оро, Фи» вычисляется по фор- 


муле 


P (A) = ar (Іө, 1) = ПАЛИ. 

Классическое определение вероятности есть не что иное, 
как формула, записапиая в словеспой форме: вероятность лю- 
бого события Де Æ есть отношение числа пл элементарных 
исходов, благоприятствующих данному событию А, к общему 
числу п равновероятных элементарных событий. 

В рамках классической схемы вычисление вероятностей 
сводится к подсчету комбинаций элементарных исходов, бла- 
гоприятствующих событию, и подсчету общего числа равно- 
вероятных элемептарпых событий. Очевидно, что классическо- 
му определению вероятности соответствует вероятностное про- 
страпство, описываемое моделью «урна». 

Пример 1-19. При бросании «правильной» монеты мы при- 
нимаем равновероятпым выпадение «герба» и «решки», т. е. 
Р («герб») =P («решка») = 1/2. 

Пример 1-20. При бросании «правильной» игральной кости 
мы принимаем равновероятными все элементарные исходы, 
т. е. Р(1) =Р(2) =...=Р (6) = 1/6. Тогда вероятность, скажем, 
события А, заключающегося в выпадеппи цифры <5, pasna 
Р(А) =5/6, так как из общего числа п--6 равновероятных HC- 
ходов Пд--Э благоприятствуют событию А. 

Пример 1-21. При скрещивании гетерозигот Аа мы пред- 
полагаем равновероятность образования четырех типов зигот 
(АА, Аа, аА, аа), считая разными элементарными исхо- 
дами появление потомка Аа от слияния: 1) яйцеклетки А и 
спермия а, 2) яйцеклетки а и спермия А. Тогда вероятность 
события В, заключающегося в появлении потомков с доминапт- 
ным признаком, равна Р(В) = 3/4. 


$ 8. ГЕОМЕТРИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 


Рассмотрим теперь вероятностное прострапство, соответст- 
вующее модели «мишень». Введем следующие ограничения па 
вероятностное пространство (0, Æ, P): 1) множество эле- 
ментарпых исходов © есть ограниченная фигура евклидовой 
плоскости, имеющая копечную площадь $ (0) < +оо; 2) алгеб- 
ра событий Æ состоит из тех подмножеств А множества Q, 
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для которых можпо определить площадь 5(А); З) вероят- 
ность P(A) события АЕ. пропорциональна площади множе- 
ства А:Р(А)--Е.5(А), где А — некоторый положительный 
коэффициент пропорциональности. 

При таких ограничениях нетрудно получить явное задание 
вероятности P(A) события Де оў: поскольку Р(Ә)--і и 
Р(Ә)--Е:5(0), то Е=1/5 (9). В результате получаем фор- 
мүлу, называемую геометрическим определением вероятности: 


Р(А)=5$(А).5 (9). 


Очевидны видоизменсния, которые падо ввести в геомет- 
рическое определение вероятности, чтобы опо стало примепи- 
мым к случаю одномерной мишени (отрезок прямой) и к слу- 
цаям мишеней, являющихся подмножсствами прострапств, име- 
ющих более двух измерений. 

Подчеркием особо, что пространство, подмножеством кото- 
рого является множество элементарных исходов ©, не обяза- 
тельно совпадает с реальным физическим пространством, в ко- 
тором происходит случайное испытание; напротив, простран- 
ство может быть образовано любыми параметрами наблюдае- 
мого объекта. Продемонстрируем это па классическом примере 
случайного испытания, посящего название «игла Бюффона». 

Пример 1-22. Случайное испытание состоит в бросании на- 
‘гад иглы длиной 21 на плоскость, расчерченную прямыми, 
расстояния между которыми равны 2а (1<а). Какова Bepo- 
ятность того, что упавшая игла пересечет одну из прямых? 

Чтобы использовать геометрическое определение вероятно- 
сти, параметризуем наш случайный эксперимент, выбрав в ка- 
честве параметров расстояние х от центра иглы до ближай- 
шей прямой и угол ф между иглой и этой прямой (рис. 7). 
Иными словами, мы сопоставили случайному испытанию дву- 


A 


т 


Рис. 7. Случайное испытанне «игла Рис. 8. Множество элементарных 

Бюффона» состоит в бросании на- исходов случайного испытания, со- 

угад иглы длиной 21 на плоскость, стоящего в бросании наугад иглы на 

расчерченную параллельными npa- расчерченную параллельными пря- 

мыми, расстояние между которыми мыми плоскость 04(ф,х): 0<Ф< 
равно 2а, где [< а. <л,0<х-<а). 
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мерпос пространство параметров (ф, х), где 0<ф=<л, 05 
<х=а. Любой исход случайного бросания иглы на плоскость 
представляет собой точку внутри соответствующего прямо- 
угольника с основанием л и высотой а (рис. 8). 

Итак, исходному случайному испытанию соответствует мо- 
дель «мишень», в которой множество элементарных исходов 
есть прямоугольник Q= {(ф,х)}: О<ф<л, О<х<а, а Bepo- 
ятность попадания в подмножество А множества Q пропор- 
циональна площади этого подмножества. Заметим, что послед- 
ние слова о вероятности попадания в подмножество множест- 
ва элементарных исходов и есть формализация употребляв- 
шегося ранее выражения «игла бросается наугад». В множест- 
ве О можно указать множество исходов А (незаштриховап- 
пая часть множества (2 на рис. 8), благоприятствующих собы- 
тию, состоящему в пересечении иглой линии: А--((9, х): x< 
<<1віп $}. Чтобы определить вероятность события А, остается 
пайти площадь всей мишени Q: 5 (©) =ла, площадь множест- 
ва А: 5 (А) =| зтфаф = 21 и поделить вторую площадь на 
первую: Р(А) =2 Ила. 

Отметим, что различпые варианты и обобщения задачи 
Бюффопа находят сейчас широкое применение в разных обла- 
стях биологии, в частности при исследовапии трехмерной 
структуры объектов, когда известны только их сечения или 
проекции на плоскость.“ 


$ 9. ПОСЛЕДОВАТЕЛЬНОСТЬ СЛУЧАИНЫХ ИСПЫТАНИЙ 


Рассмотрим еще один важный частный случай вероятност- 
пого пространства (Q, Æ, Р), который позволит нам ввести 
понятие независимых испытаний. 

Обратимся к модели «мишень». Как мы уже знаем, мно- 
жество элементарных исходов Q в этом случае есть совокуп- 
ность точек плоскости, попадающих в единичный квадрат. 
Элементарный исход о можно представить в виде двумерного 
вектора w= (o, о), первая координата которого есть YH- 
сло œ, взятое из множества Q, представляющего собой oT- 
резок [0, 1] горизонтальной оси, вторая координата — число 
000), взятое из множества Q, представляющего собой отрезок 
[0, 1] вертикальной оси (рис. 9). 

Выделим из алгебры .%, соответствующей универсальному 


Жж ж 
множеству ©, алгебру 5), включающую множества ДА!) 
двумерных векторов w= (o, 0), у которых первая коор- 
дината принадлежит некоторому подмножеству А@)<=00), 
а вторая координата может принимать любые значения из 


Ж 
мпожества 00). На рис. 9 одно из множеств АП) показано Bep- 


* См.: Число и мысль. М., Знание, 1977, с. 42—48. 


тикально заштрихованным прямоугольником. Аналогично из 
Ж 
ж можпо выделить алгебру 4), включающую множества 


AN 
АФ двумерных векторов, первая координата которых может 


ДО 


Рис. 9. Последовательность случайных испытаний. 


Множество элементарных исходов % случайного испыта- 
ния (, состоящего в бросании наугад точки в единичный 


квадрат, ссть сам этот квадрат: 2--(» (1), о(2)), 0< 1) <1, 0<о(2} <1 
Множество А (1) включает элементарные исходы, для которых, 
o(De 401) из #1) и (2) (2) . Множество А(2) включает эле- 


9 с 
ментарныс исходы, для которых «(0690) и о()6А(2) из 92) 
Испытание можно представить как последовательность двух неза-* 


висимых испытаний (бі H С 2, заключающихся в бросаним 
ТОЧКИ на горизонтальную Ф(1) = [0, 1] H 


І вертикальную 
(2) = 10, 1] оси. 


принимать любые значения из множества Q, а вторая при- 
надлежит некоторому подмножеству 40)< 90), На рис. 9 одно 
А 


из множеств А@ показано горизонтально заштрихованным 
А 
прямоугольником. Для каждого А, принадлежащего Æ, можно 


Ж 
указать вероятность Р(АФ); поскольку квадрат на рис. 9 
имеет площадь, равную едипице, эта вероятность равна 


Ж 
просто площади соответствующего прямоугольника: Р(АФ)-- 
ж ж ж. ж 
--5(4%), Но событие AVE AOSE 5 находится 


3 Зак. № 122 


во взаимно- 
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одпозначном соответствии с событием 4(9< 90. Поэтому собы- 
тия вида AEQ) также образуют некоторую алгебру 20), на 


которой можно задать вероятность РФ(Д09) = Р (40). В слу- 
чае, изображениом на рис. 9, эта вероятность равна просто! 
длине соответствующего отрезка: Р (А) =L (А09). 

Таким образом, от случайного испытания (6, описываемого 
вероятностным пространством (Q, Æ, P), мы перешли к двум 
случайным испытаниям 6; и бо, описываемым вероятностны- 
ми пространствами (00, A, РО) и (09,4%, РФ). Други- 
ми словами, двумерное случайное испытание (6 порождает 
два одномерных случайных испытания 6) и 62. Испытания 
бін 62 будем называть маргинальными* (частными) испы- 
таниями. Соответственно вероятностное пространство (Q, Æ, 
Р) будем называть совместным вероятностным пространством, 
а пространства (09, 9, РФ) — маргинальными вероятност- 
ными пространствами. 

Среди событий из алгебры Æ наибольший интерес пред- 
ставляют события, состоящие в том, что в первом маргиналь- 
ном испытании произошло событие АФе-. 0, а во втором — 
событие А@є A. Эти события можно представить в виде 


ғ” Ж 
пересечепия АПА, Используя формулу умножения вероятно- 
стей, имеем 


Р(АХ а А®) жен р(29/2%). ро (д0)) = Р(АФ Д). ро (4%), 


Из этой формулы видно, что В общем случае для вычисления 


вероятности событий ШАРДЫ) нужно знать маргинальпые веро- 
ятности и условные совместные вероятности. Однако если со- 


AN AN 
бытия АС) и ДС) независимы, то достаточно знания только Map- 
гинальпых вероятностей: 


Р(А®П ДФ) — р (400). PO (А®), 


Полное сведёние совместной вероятности к маргинальным 
вероятностям очень важно в приложениях теории вероятно- 
стей; оно положено в основу понятия независимости испыта- 
ний. Испытания 6: и 62 являющиеся маргинальными испы- 
таниями для испытания 6 = (бь, 62), называются независимы- 
ми, если для любых событий АЕ, 0) и ADE 0) имеет место 
указанное равенство. Следует обратить внимание, что приве- 
денные рассуждепия о связи маргинальных и совместных веро- 
ятностей дают метод установления связи между разными 
вероятпостпыми пространствами. Это особенно важно при изу- 
чении последовательностей случайных испытаний. 
Введепие маргинальных вероятностей в модель «мишень» мож- 


* От англ. marginal — крайний, предельный, граничный. 
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но представить в виде последовательпого бросания точки вна- 
цале па ОФ, а затем на (02). Точно так же можно интерпрети- 
ровать бросание двух монет (см. задачу 1-11), игральных кос- 
тей, появление двух потомков в скрещиванни и т. д. 

Заметим, что все приведенные выше рассуждения могут 
быть обобщены на последовательность любого числа испыта- 


ний 6= (61, 62, ... бл). При этом независимость испыта- 

ний 61 69...» бл В дальнейшем мы будем понимать как He- 
| ж л ж 

зависимость событий АФ, A, ... А) в совокупиости. 


$ 10. СЛУЧАЙНАЯ ВЕЛИЧИНА 


Рассмотрим числовое мпожество элементарных исхо- 
дов Q. Будем рассматривать случайное испытание, результатом 
которого может быть любое число из множества действитель- 
ных чисел 9 =А!={— оо, оо}. Если реальные случайные испы- 
тания не охватывают всего множества А', соответствующим 
миожествам будем приписывать нулевую вероятность. 

Обозначим «а, Б> диапазон чисел от а до b. Запись 
<a, 6> означает любой вариант расстановки круглых и квад- 
ратных скобок: (а, b), (а, ё), (а, 6] и (ав, b]. При изучении 
случайных испытаний, имеющих в качестве исходов чиела, ин- 
терес представляют события, состоящие в том, что число, 
являющееся исходом, попадает в тот или иной диапазон 
<a, b>. Поэтому обязательным требованием к алгебре слу- 
чайных событий испытания с числовыми исходами будет тре- 
бовапне содержать любой диапазон <a, б>. Наименьшая из 
алгебр, содержащих все диапазоны указанного вида, будет 
обозначаться H. 

Для задания вероятности P случайных событий из алгебры 
Я, достаточно рассмотреть лишь событня вида (а0,0). В свою 
очередь, задание вероятност" Ра, 6)) можно упростить: 
представляя множество (— со, б) в виде двух непересекающих- 
ся мпожеств (— оо, а) и |а, b), получаем соотношение 


Р Ца, b) -+Р(- о, 8) -Р(- œ, а)). 
Величину 
Ғ(д--Р(- е, х), 

определенипую для любого действительного числа х, называют 
функцией распределения вероятностей. Тогда 

Р Ца, b)) =F (b)—F (a). 
Таким образом, знание функции распределения F(x) позволяет 
задать вероятность P па алгебре Äi подмножеств множества 


К'. Поскольку различные случайные испытания с числовыми 
исходами имеют одинаковые Q=R! и ,, различаясь только 


3* 35 


ланпом вероятности, постольку функция распределения F(x) | 
несет полпую ипформацию о случайном испытании с числовым | 
ІСХОДОМ. 

Задание вероятностного прострапства |Е!, %,, Е(х) |, onu- 
сывающего случайное испытание $ с числовыми исходами, 


будем называть заданием случайной величины х,% пробегаю- 
щей множество значений 9 = №!. При этом вероятность собы- 
тия А будет интерпретироваться как вероятность попадания 


случайной величины х в множество А. Вероятность попадания 
х в отрезок (а, 6), т. е. вероятность события A= {а=х<8}. 
определяется функцией распределения случайной величины х: 


Р{а< х < b= Е(0)-Е(а). 


Пример 1-23. Случайное испытание состоит в бросании на 
ровпую поверхность симметричного кружка, на одну сторону 
которого нанесена цифра 0, а на другую — 1. Чтобы приме- 
нить введенную выше схему, будем считать, что возможными 
нсходами испытания являются все действительные числа 
< —А'. Соответствие же этой схемы реальной зксперименталь- 
ной ситуации обеспечим следующим способом задания вероят- 
ности. Вероятность события А из алгебры Жі определим так, 
что: 1) Р(А) =0, если множество А не содержит чисел 0 и 1; 
2) Р(А) = 0,5, если один из элементов (0 или 1) содержится 
в А; 3) Р(А)--і, если оба элемента (0 и 1) содержатся BA. 
Отсюда следует выражение для функции распределения слу- 


чайной величины х: Ғ(х)--0, когда --оо<<х-<0; F(x) = 0,5, 


когда 0<х<1; Е(х)--1, когда 1<х<оо. Заметим, что для 
использования понятия случайной величины мы должны рас- 
сматривать числовое множество. Поэтому при использовании 
случайных величин для описания, например, случайного бро- 
сания монеты следует сопоставить исходам «герб», «решка» 
какие-либо числа, скажем «решка» — 0, «герб» — |. 

Пример 1-24. Случайное испытание состоит в выборе на- 
угад семьи и установлепии в ней числа детей #--0, 1, 2, 
Сколь велико может быть число детей в семье? Ясно, что у 
данной супружеской пары не может быть 1000 детей. Но, ис- 
‘ключив границу 1000 как слишком завышенную, мы тут же 
снова ставим вопрос о максимально возможном числе детей. 
И па него пет ответа, поскольку нет оснований полагать, что 
могут быть семьи с А детьми и не может быть семей с (+ 1) 
детьми. Поэтому лучше не ограничивать множество исходов, 
считая, что оно охватывает все множество Ю!. Ясно, что для 


* Над буквой, обознамающей случайную величипу, мы всегда будем CTA- 
вить знак — («тильда»). 


Э 


х<0 нужно задать нулевые вероятности; это же касаетея и 
положительных дробных чисел. Но как определить вероятности 
для целых чисел от | до оо? Это потребует привлечения дан- 
ных демографии и построения некоторой статистической тео- 
рни, изложенной в $ 4 гл. И. 

Если случайное испытание & имеет элементарные исходы, 
характеризуемые двумя числами (хі, Хо), то по аналогии с од- 
померпым испытанием будем считать множеством элементар- 
ных исходов всю плоскость А, т. е. множество всех пар дейст- 
вительных чисел --оо<Х|<о0, -оо<Х9<оо0. В качестве алгеб- 
пы случайных событий выберем минимальную алгебру %;, 
содержащую все прямоугольники вида А = {(х1,х2): а < 
Lx <b 0<х<6,). По аналогии с одномерной случайной 
величипой введем функцию распределения Ғ(хі, X2) двумер- 


пой случайной величины, определенную для пар действитель- 
ных чисел: 


Е(х, х) =P (b, В): - о <А< х, - со < h < Xa). 


Таким образом, знание двумерной функции распределения 
Е (хъ, Хо) позволяет задать вероятность Р на алгебре #, под- 
мпожеств мпожества А?. Поскольку различные случайные nc- 
пътапия с двумерными числовыми исходами (хі, хг) различа- 
ются только заданием вероятпости (множество А? и алгебра 
7. всегда одни и те же), то функция распределения Ғ(х1, Хо) 
несет полную информацию о таком случайном испытании. 

Подобно тому как это было сделано в предыдущем пара- 
графе, случайное испытание 6 с двумерными числовыми исхо- 
дами можно представить в виде последовательпости двух 
одномерных случайных испытаний б, и 62. Вероятностное 
пространство (А?, B», Р) позволяет определить маргинальные 
вероятностные пространства (Ю, B, РӘ)и (В Bi, РФ), 
описывающие случайные испытапия 61 и 62. Вероятностное 
пространство (Ю', %,, РФ) соответствует одномерной марги- 


нальной случайной величине х;, имеющей функцию распреде- 
лепия Ғі(х). Последняя позволяет задавать вероятность РО 
па алгебре .2,, і=1, 2. Мы будем обозначать случайную 


величину х в виде вектора (xı, Хо), компонентами которого 
являются маргинальные случайные величины. Тогда попада- 
пие двумерного исхода в прямоугольник А={(х1, Хо) ах, < 
<b, йо << хо< во) можно интерпретировать как событие, состоя- 


шев в одновременном выполнении неравенств а415<Х1<), 


а05-Х:<б, а функцию распределения можно условно записать 
в таком виде: 


Е (хи, х)-əңҺР(-ө<х,<Х,- 9<Хх,<Х,)- 
= P ах, X< Xaj. 
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В простейшем случае пезависимости случайных испытаний 


функция распределения Е(х), хә) случайной величины х одно- 
значно определяется функциями распределения Ё, (х), Ғо(х) 


маргипальных случайных величии х], Хо: 
F (Xi, Х) = Еу (x1) Fo (хо). 


При этом х H Хо называются независимыми случайными вели- 
чинами. 

По аналогии можно записать многомерную (п-мерную) 
функцию распределения 


А ПЫ ама ав) о оо, L Xn] = 
= < А, 6... у АЖЖ, 


задающую вероятность Р па алгебре случайных событий Ф,, 
представляющих собой подмпожества 0 = №". По аналогии же 


в случае независимости маргинальных случайных величин ху, 
во е) Ха 


Ах, а == вж Р; (х0). 


Чтобы случайпые величины были иезависимыми, это соотпоше- 
ние должно выполняться для всех их пар, троек, четверок и т. д. 
(ср. с понятием независимости п случайных событий — $ 6). 

В следующих двух главах подробно изучаются случайные 
величины, важные для биометрии, и действия над ними. 


Задачи 


1-1. Постройте модель «урна», описывающую случайные испытания в 
примерах 1-3 и 1-5. 

1-2. Постройте модель «мишень», описывающую случайные испытания 
в примерах 1-4, 1-6 и 1-7. 

1-3. Пусть элемсптарные события представляют собой точки действи- 
тельной оси. Для любых a<b опредслим события A= (а, b] как множество 
точек х, таких, что а< х <Б. Пусть А, = (а, В] и Аҙ-(а;, 85] — два события. 
Тогда: а) что графически означает ANA: =), чему равно при этом АЦ)»; 
б) при каких условиях, накладываемых на числа а, bi, а, Әҙ, будут иметь 
место события: АПА.=А, AUA: =A; А.ПА= 2 

І-4. Покажите справедливость следующих свойств частоты случайного 
события: а) если А--О, то Л(А; п) =0; б) если ASB, то #(А; п) <№(В; п); 
в) А(4; п) =1—1(А; п); г) если АПВ=@, то (АЦВ; п) =А(А; п) +В (В; п); 
д) #(АЦВ; п) =й(А; п) + (В; п) (АПВ; п). | 

[-5. Покажите, что для условной вероятности Р(А/В) выполняются 
аксиомы теории вероятностей. 

1-6 (Задача С. Н. Бернштейна). На стол бросают правильный тетраэдр, 
одна грань которого белая, другая — черная, третья — красная, а четвертая 
раскрашена всеми тремя красками. Вероятность выпадения граней одинако- 
са. Событием Б (Ч или К) назовем выпадение грани, на которую нанесена 
белая (черпая или красная) краска. Покажите, что эти события попарно 
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независими, т. е. Р(БЧ) =Р(Б) -Р(Ч) и т. д. Покажите, что эти события 
в совокупности зависимы, т. с. Р(БЧК)=ЕР(Б) - Р(Ч) -Р(К). Сравните эту 
задачу с примером 1-17. 

1-7. В урне содержится п; шаров первого сорта, п. — второго, ..., 
п,—г-го сорта; п, +... + п. =п — общее число шаров. Рассмотрите три cno- 
соба выбора шаров: а) наугад извлекаются сразу т шаров (неупорядочен- 
ная выборка объема т); 6) наугад выбирается один шар, фиксируется его 
сорт, шар возвращается в урпу, содержимое урны тщательно персмешивает- 
ся, снова вынимается один шар и т. д. (последовательный выбор с возвра- 
шеннем т шаров); в) т шаров вынимаются один за другим и не возвра- 
шаются в урну, благодаря чему при каждой выемке изменяются объем и 
состаз урны (выбор без возвращения). Какова вероятность того, что в вы: 
боркс объема т имеется пи шаров первого сорта, т; — второго, ..., т,--Г-ГО 
сорта? 

1-8 (Парадокс де Мсре). «Толчком к появлению интереса Паскаля к за- 
дачам теорни вероятностей послужили встречи и бессды с одним из при- 
дворных французского королевского двора — шевалье де Мере (1607—1648). 
Де Мерс интересовался философией, литературой и одновременно был 
азартным игроком. В этом можно видеть истоки тех теоретических вопро- 
сов, которые ои предложил Паскалю».* Вот один из них. Сколько раз надо 
подбросить две игральпые кости, чтобы вероятность выпадения хотя бы 
один раз двух шестерок была бы больше 1/2, т. е. была бы больше вероят- 
ности нх невыпадения? 

Задача эта возникла в связи со следующей игрой. Две кости подбрасы- 
palor заранее оговорсипое число раз. Можно ставить либо на псявление 
«дубля» хотя бы один раз, либо против такого результата. Де Мере зпал, 
что при бросанни одной кости 4 раза вероятность выпадения шестерки 
превышает 1/2. Следовательно, рассуждал он, для двух костсй достаточно 
в 6 раз больше бросаний, т. с. 24 бросания. 

Так ли это? 

1-9 (Парадокс Бертрана). «Бертран (а затем и Пуанкаре) рассматри- 
васт следующий вопрос. Три одинаковъх ящика имеют каждый по два от- 
деления. Первый содержит в каждом отделении по золотой медали, вто- 
пой — го серебряной, а третий — в одном отделении золотую, а в другом — 
ссребряную. Взят один из ящиков... Какова вероятность того, что, взяв 
ящик и вскрыв одно отделение, во втором отделении этого ящика обпару- 
жим медаль другого металла, чем во вскрытом отделении?»** 

1-10. Чему равна вероятность того, что: а) дни рождения 12 человек 
придутся на разные месяцы года (при условии, что вероятности попадания 
дня рождения на каждый месяц остаются равными для всех месяцев); 
6) дни рождения 6 человек придутся в точчости на два месяца? 

1-11. Проинтерпретируйте, следуя $ 9, случайное испытание &’, состоя- 
щее в бросании двух монет, в терминах двух последовательных испытаний 
бі и Фо, состоящих в двух независимых бросаниях одной монеты. 

[-12. Покажите, что вычисление вероятности попадания двумерной слу- 
чайной величины в прямоугольник А={ (х1, Хо) :аа<х<В, (а:<Х:<0:) прово- 
дится по формуле Р(А)-Ғ(5, б)--Ғ(а, ba)—F (bi, а») + Е (а, a2). 


* Гнеденко Б. В. Из истории науки о случайном (Из истории мате- 
матических идей). М., Знание, 1981, с. 17. | 

** Майстров Л. Е. Развитие понятия вероятности. М., Наука, 1980, 
с. 215. 


ГЛАВА II 


ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 


— 


Поскольку случайпая величина х полпостью определяется 
своей функцией распределения Е(х), постольку различные 
частные виды случайных величин можно получить, палагая 
определенные ограничения на F(x). 

Среди многообразия случайных величин можно выделить 
два обширных класса: дискретные и непрерывные случайные 
величины. 

Дискретными случайными величинами называются такие, 
функции распределения которых имеют вид 


Е(х) = Зи x;<x Pis 


где pi<0, pot... +pnt...=1, <<... <... а сумми- 
рование ведется по всем индексам і, для которых числовые 
значения х; не превосходят величины х. 

Выясним смысл величин р; и х;. Для этого найдем вероят- 


ПОСТЬ ТОГО, ЧТО случайпая величина х принимает значения Xi: 


P {x =x} =P [X < х) = Е (ха) — Е (x) = P: 
Таким образом, р; суть вероятности того, что случайная ве- 
личина х принимает значения х;. Нетрудно показать, что для 
xÆ xi (для любого значения х;) имеет место Р(х--х) =0. От- 


сюда следует, что дискретная случайная величина х принимает 
с ненулевыми вероятностями р; лишь значения х;. Число таких 
значений может быть или конечно (хо, ..., Ха), или счетно 
(Хо, ..., Xn, ...). Совокупность значений {х;, рі) называется 
распределением вероятностей дискретной случайной величины 


х. Так как распределение (х;, р} полностью определяет функ- 
цию распределения F(x), то оно однозначно задает дискретную 


случайную величину х. 
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$ 1. ЦЕЛОЧИСЛЕННЫЕ СЛУЧАИНЫЕ ВЕЛИЧИНЫ И ИХ 
СВОЙСТВА 


В большинстве биометрических исследований можно огра- 
ничиться рассмотрением частного случая дискретной случай- 
ной величипы, когда значения х; целочисленны: Хо--0, хр = 1, 
гә Хаз-П,.... У таких целочисленных случайных величин 
-пачения х; совпадают с их индексами: х;= что позволяет 
понимать под распределением вероятностей целочислениой слу- 
чайной величины набор (рі) одних только вероятностей рг2>0. 

Фупкция распределения целочисленной случайной величины 
имеет вид 


F (x)= DeeP 


где суммирование ведется по всем индексам г, меньшим зна- 
чения x. Геометрически F(x) 
представляет собой монотонно 
нсубывающий ступенчатый 
график с разрывами и соответ- 
ственно скачками величиной 
ро, Pis ..., Ри, ... В точках 0, 1, 
.... №, ... (рис. 10). Для х<0 
значение Е(х) =0, а при х—> < 
значение Р(х)-— 1. 
Распределение вероятностей 
и функция распределения мо- 
гут быть заданы также в виде 
таблицы. Рис. 10. Целочисленная случайная ве- 
Пример П-1. Производится личина. ^ 
однократное подбрасывание а — распределение вероятностей {Pi} 
нгральнои кости. Тогда, с од- б-- функция распределения F(x). 
ной стороны, в соответствии с 
результатами гл. І имеем множество элементарных исходов Q = 
—{1, 2, ..., 6}. Для элементарных событий, соответствующих 
этим исходам (в предположении симметрии кости), можно за- 
дать вероятности pi= 1/6, где 1=1, 2,..., 6. С другой стороны, 
в силу того, что элементы мпожества © — числа натураль- 
пого ряда, можно говорить о целочисленной случайной вели- 


чине х: М 
і 0 1 9 3 4 5 6 7 8 ; 
Pi O 16 16 16 16 16 16 0 0 
F(x) 0 0 16 26 36 46 5, 1 І 


Вычислим вероятность того, что такая случайная величина при- 
мет значение, большее трех: 


4} 


Р(Х>38|--Ріх--4),--Р|х--5|--Р(х-б)--Ріх--7|-Б..- 
р-р РРР... =1/6 - 116 + 116 +0... = 1/2. 


Эту вероятность можио вычислить также, обратившись к функ- 
ции распределения: 


Р(х > 3} = (92) —Е (4) =1— 1/2 =1,2. 


Однократное подбрасывание игральной кости — это пример 
целочисленной равномерно распределенной случайной вели- 
чины, принимающей конечное число значений. Целочисленное 
равномерное распределение может быть получено и из модели 
«урна». В урне находятся М шаров, пронумерованных от 1 до 
№ Если производится выбор шаров по одному с возвращени- 
ем, то номер і извлеченного шара есть целочисленная равно- 


мерно распределенная случайная величина х: 
РА им. 


Зачастую помимо полного описания распределепия жела- 
тельно иметь небольшое число характеристик, выявляющих ос- 
новные его черты. Такие характеристики носят название пара- 
метров распределения. 

Параметром в математическом анализе обычно называют 
величину, входящую в формулы и математические выражения, 
значения которой считаются фиксированными в пределах рас- 
сматриваемой задачи. 

В математической статистике термин «параметр» употреб- 
ляется в двух значениях: а) как фиксированная переменная, 
входящая в формулу того или иного распределения, и 6) как 
величина, характеризующая некоторое свойство распределе- 
ния, — То же, что показатель, характеристика. В этом смысле 
говорят о параметрах (числовых характеристиках) положе- 
ния и рассеяния. 

Параметры положения отражают группировку значений 
случайной величипы вокруг некоторого «центрального» значе- 
ния, к ним отпосится прежде всего среднее значение. 


Величина 
— % А 
Ех = 2 “и 
называется средним значением, или математическим ожида- 


нием, целочисленной случайной величины х, имеющей распре- 
деление вероятпостей ір). 
В примере П-1 


а 6 , ; ! 
Ех<У ір: = 1:116 4...4 6:16 -+ 3,0. 
Пример 11-2. Обратимся к анализу числа детей в семье. 
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Пусть семьи, имеющие 0 детей, встречаются с вероятностью 
ро; имеющие 1 ребенка — с вероятностью рі; i детей — с Bepo- 


100 . 
ятностью pi. Тогда Ех = 2 ipi. 


В общем случае дискретной случайной величины х ee Ma- 
тсматическое ожидание Ех определяется формулой 


сене 2. х; р). 


Параметры рассеяния характеризуют степень варьирования 
зпачений случайной величины, степень ее «изменчивости». 
Важнейший среди них — дисперсия (иногда говорят «вариан- 
са» — от апгл. уагіапсе). 

Дисперсия целочисленной случайной величины х опреде- 
ляется формулой 


к= Е |х 


Ех] == р (— Ех). 


Простые преобразования дают следующее выражепие для дис- 
персии (см. задачу П-3): 


Dx = е) 20 р (У ipi}. 
В примере 11-1 
Ох= | + 4-H... +35] Е 6 — 3,5? = 5,92. 


3 более общем случае дискретной случайной величины х ее 
дисперсия определяется формулой 


— Ел да: е --- е? 4 х = 
а рр Ва Ру БУЫ!) у 


a 
Величина ) Dx пазывается средним квадратичным отклоне- 
нием, или стандартным отклонением, случайной величины х. 


$ 2. СОВМЕСТНОЕ РАСПРЕДЕЛЕНИЕ, СУММА, НЕЗАВИСИМОСТЬ 
ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН 


Число детей в семье, рассматривавшееся выше, есть одно- 
мерная случайная величина. Однако если в семье учитыва- 
ется число мальчиков и число девочек, то это будет уже дву- 
мерная случайная величина. Множество значений, прини- 
маемых с ненулевой вероятностью двумерной целочисленной 


случайной величиной x= (xı, Хо), описывается набором пар 
чисел (р, j), где i=0, 1,2, ...; |--0,1,2,... графически 
представленных в виде целых точек положительного квадранта 
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(рис. 11). Множество этих точек и есть простраиство элемен- 
тарных исходов 9={0:;}=={(0, 0), (0, 1), (1, 0), (1, 1), ...}. 
Каждому элементарному событию {0:}}=1 j} отвечает Bepo- 


ятность р:/>0, прич л У? p, = 
р:.>0, причем Sio Zop =L. Говорят, что 


Рис. 1. Сумма целочисленных {Pii} = {роо, Ро Ро,» Ри } — рас- 
пределение вероятностей двумер- 


ной целочисленной случайной ве- 


Личины х= (X1, Хо), или совмест- 
ное распределение случайных ве- 


ЛИЧИН Хі И Хо. 

Выясним, каким образом, 
зная совместное распределение 
целочисленных случайных вели- 


чин ху И х, можно найти распре- 
деление каждой из них в отдель- 
ности, т. е. их маргинальные рас- 
пределения. Введем удобное обо- 
значение: 


случайных величин. 


Целочисленные точки, попавшие в 
заштрихованную область, образуют со- Pi. = ри + рн + Ро +... = 


бытие Ap» состоящее в том, что 
сумма случайных величин xit а? ри: 
равна k. 2-0 1 


рртрр Pyt Pyt. = Ўр Ро 


т. е. точка па месте определенного индекса означает сумми- 


Е Ы 19 7 у = хас? ТЕГІ 
рование по этому индексу; очевидно, >, „Ри. Ги Я 


Очевидно, что {p:i} — это распределение вероятностей случай- 
ной величины хі, а {р.;} — распределение вероятностей случай- 
ной величины Хо. Действительно, обозначим А; событие, состо- 
ящее в том, что ХІ принимает значение, равное г. Имеем А; = 
= (0), D 2) а T eA Це 0 (ог). Следовательно, 
РДЕ Рае Ро оба 

Аналогично доказывается, что р.; — это вероятность собы- 
THA {=}. 

В дальнейшем будут возникать вопросы, связанные с CYM- 
мой случайных величин. Рассмотрим наряду с х H Xo новую 
случайную величину Х--Х|--Х9. Каково распределение вероят- 
ностей {pa}, Е--0, 1,..., случайной величины x? 


Теорема Il-1. рь = У: P: ui 
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Доказательство. Обозначим А, событие, состоящее в том, 


что х принимает значение, равное k. Имеем (см. рис. 11) 
Ав={ (0, k), (1, Е— 1), 626 269 (А — 1, 1), (k, 0)}, Т. е: Арета 
=U Êo {о: һ:). Следовательно, 


= Р(А) = У; „Р(о TE > ок 


< 1—0 


т. е. суммируются вероятности тех точек, сумма индексов ко- 
торых равна № (заштрихованная область на рис. 11). 
Сумма случайных величин является важным частным слу- 


чаем функции случайных величин Ф (х1, хо). Для функции ф от 


случайных величии х;, Хо можно ввести понятие математическо- 
го ожидания: 


Е [9 (х, х ЖЕЛЕ Зи Jy Pije 

Решепие ряда задач количественной биологии опирается 
па понятие независимости случайных величин. Пусть P{x = 
= k|xa= l} — условная вероятность того, что случайная вели- 
чина XI примет значение k, если случайная величина Xo прн- 


няла значение l. Случайные величины Х и Хо независимы, если 
для любых ги | 


P |x = Их, = Л = Р [x =i}. 
Каково совместное распределение (р;) двух независимых 


случайных величин хі и хо? Справедлива следующая теорема. 


Теорема 1-2. Целочисленные случайные величины х и Хо 
пезависимы тогда и только тогда, когда для всех і, |--0, 1 
будет pij=Pi. Pj. 

Пользуясь результатами двух приведенных выше теорем, 
ответим, пакопец, на вопрос: каково распределение суммы двух 
независимых случайных ғ величин? 


Теорема 11-3. Если xı H Xə — независимые целочисленные 


случайные величины, то распределение {pr} их суммы X=% + х› 
— У» 
имеет вид ра 0р;.Р.; (һау): 


Доказательство. Действительно, как следует из рис. 11. 
k k 
P=, Рі k—=i йр Pir-i) 


Соотношения между понятиями совместного распределения, 
суммы и пезависимости целочисленпых случайных величин про- 
иллюстрируем на примере. 


Пример П-3. Дважды бросают игральную кость; число оч- 
ков, выпавшее в первый раз, — значение случайной величины 
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ху, во второй раз — Хо. Тогда совокупность вероятностей собы- 
тий {1, 1}, {1,2},..., {6,6} — это совместное распределение слу- 


чайных величин х; и Хо. Совокупность вероятностей событий 
«сумма очков, выпавших оба раза» — (2), {3}, ..., {12}, — это 


распределение случайной величины: X, являющейся суммой ху п 


Хә. Если результаты первого эксперимента (выпадение опреде- 
ленпого числа очков в первый раз) не изменяют распределения 


вероятностей во втором эксперименте, то х; и хо независимы. 
$ 3. ПРОИЗВОДЯЩИЕ ФУНКЦИИ 


При изучении целочисленных случайных величин часто поль- 
зуются аппаратом производящих функций, позволяющим эффек- 
тивно решать вопросы, связанные, в частности, с анализом рас- 
пределений сумм случайных величин. Степенной ряд 


G (у) = po + ри + ру? +..., 
определенный при 0 < y < 1, называется производящей функ- 


цией целочисленной случайной величины х с распределением 
вероятностей (рі). 

Выясним свойства производящих функций. Обозначим С” 
производную производящей функции (С. Убедимся вначале, что 
С (у) и С" (у) положительны при у> 0. Действительно, пусть 
р> 0 (10). Тогда С (у) > ри! > 0. Первое утверждение goka- 
зано. Далее 0 (у) = У, р, у! >> 1р, у> 0 при у> 0. 


=1 

Итак, поскольку С (0) = po u С(1) = 2 22) -- 1, можно утвер- 
ждать, что производящая функция при увеличении у монотонно 
возрастает от ро до 1. 

Обозначим G® (y) 1-ю производную функции б (у). Укажем 
связь между распределением вероятностей целочисленной слу- 
чайной величины и производными соответствующей производя- 
щей функции. 


Теорема Н-4. р, = ЕА а (0). 


Доказательство. Выпишем последовательно выражения для 
производных: 


С (у) = Др PıyY+ рум... ру +... 


О (у) = Рі --9рэу +... ЕрьУ А... 
а" (у) = 2р +... + klk—1)p у? +... 
а (у) = k! P+... 


Отсюда следует, что G(0) = po, С'(0) = pi, G” (0) = 2р,, .. 
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е? 


4 = | 

‚ 09(0) = k! рь, т. е. для любого k имеем рь т а) (0), 
что п утверждалось. 

Пусть ху н хг — независимые случайные величины с распре- 
делениями вероятностей (р) и {р ис производящими 
функциями С: (у) и бҙ(у) соответственно. Обозначим G (у) npo- 
изводящую функцию суммы х = xı + Хо. 

Теорема 1-5. С(у) = С, (и) Со(и). 

Доказательство. Рассмотрим правую часть этого равенства. 
Имеем 
Gi (У) 9 (у) =(р,+ УР У...) (Р-р У Бру +...) = 

= p Pa (РР Р.Р) У + (PoP, + РР Р.Р... . 
Следовательно, для и k коэффициент при yë, т. е. вероят- 


ность Ph будет рь =~ х „Р; Р, „ Сопоставляя этот результат 


с теоремой 11-1, ее в справедливости доказанного. 
Теорему 11-5 можно обобщить на случай п независимых слу- 
чайных величин. 
Математическое ожидание и дисперсию случайной величины 
можно выразить через производные производящей ти 


Теорема Il-6. Ех = 0"(1), Dx = 0” (1) + C (1) — [C (1) ]?. 
Доказательство. Имеем © (у) = У, р, 41 Следова- 


тельно, С” (1) = У, рь, что совпадает с определением матема- 


тического ожидания. Далее, а (у) = У, Pr k (k — 1) у°, oT- 
куда 


"U= Ур Pek (8—1) = Ур рь Ур ,Ар- 


= (= ое) (У рал) = Se вух TA 


8-1 
Так как Ох же, ёр, — (Уу ра). а), Рр, = а' (1), то 


Dx = 0" (1) + 0' (1) — [C (Ур. Следовательно, теорема дока- 
зана. 


‚ 64. РАСПРЕДЕЛЕНИЕ ПУАССОНА 


Будем изучать распределение числа колоний микроорганиз- 
мов по чашкам Петри и попробуем представить, какой вид мо- 
жет иметь это распределение. Рассмотрим отдельную чашку. 
Разделим ее мысленно на п участков столь малой площади, что 
на каждый из них может попасть не больше одной клетки — 
«основателя» колонии. Вероятность того, что на участке но- 
мера г вырастет колония, обозначим 274; так как участок выбран 
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малым, то можно считать, чго А; достаточно мала. _Следова 


тельно, участок і описывается случайной величиной х;, прини 
мающей значения 0 или | с вероятностями q® =1— А; и 
р® = 4. Допустим далее, что вероятность, вырастет ли колония 
на данном участке, не зависит от того, есть ли колонии на 


других участках. Тогда изучаемая случайная величина х — число 
колоний на данной ТАШ ы суммой независимых слу- 


чайных величин: х = Xi +... + хи. Предположим, что чашки 
не отличаются друг от друга: величина À = № + ... + Ха одна 
и та же для всех чашек. 


Данная модель описывает случайную величину х, представ- 
ляющую собой сумму большого числа неких «элементарных еди- 
ничных актов», вероятность каждого из которых достаточно 
мала. Эта модель оказывается пригодной для описания распре- 
делений самых разнообразных биологических и небиологических 
явлений: распределения числа сорняков на учетных площадках 
поля, числа клеток ‘крови по квадратам счетной камеры, числа 
мутаций, возникающих за определенный промежуток временн, 
числа несчастных случаев, телефонных вызовов за единицу вре- 
мени, числа звезд в определенном объеме пространства, числа 
распадов радиоактивных атомов и т. д., и T. п. 

Перейдем к анализу модели — изучению случайной BEJN- 


чины х. Каково распределение вероятностей {ри}, А = 0, 1, 


2,..., случайной величины x? Проведем некоторые рассужде- 
ния, основываясь на свойствах производящих функций. 


Га 


Выпишем производящую функцию случайной величины Хғ 
Ч: (у) = (1-м) + му = 1 + Мм(о-- 1. 


Для суммы x= x] +... Фа. производящая функция G в 
силу обобщения теоремы 11-5 равна 
С (у) = Gi (y) -G2(y)- ... >бһ(и). 


Прологарифмировав это выражение и воспользовавшись прн- 
ближенным равенством 


In [1 А (и 1)] = А (0—1), 
справедливым в силу малости величин Ai, получим 
In С(у) = У" In G; (у) = 2 ш [1-42 (у 1)] = 
Э AE 


Следовательно, приближенное выражение производящей функ- 
ции имеет вид 


G(y) де ВМОК) а об (1—1) 


r : 
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и обращается в точное равенство при A; —> 0, п-> оо. 
Воспользуемся теперь теоремой П-4. Имеем 


а (у)-еде 9-8, (уе Ь,..., ау) = e, 
Следовательно, 0% (0) --2%6-%, откуда 
1 | 
-- А се) 0) = Ы КӨТ, 


Выведенное нами распределение 


л 
р, ре“, ЕО 12. 


называется распределением Пуассона с параметром А. Mapa- 
метрами распределения определенного вида— в нашем случае 
распределения Пуассона — 
называют константы, значе- 
НИЯ которых однозначно 
определяют распределение 
вероятностей. Вид распреде- 
ления Пуассона для различ- 
ных значений параметра À 
показан на рис. 12. 

Следует помнить, что рас- 
пределение Пуассона получе- 
но в предположении, что слу- 


чайные величины Х; неза- 
висимы, А; малы, а А no- 
СТОЯНПО ДЛЯ единиц на- Рис. 12. Распределение Пуассона для 
блюдения (разных чашек некоторых значений параметра À. 
Петри, учетных площадок, 

отрезков времени и т. п.). Фактические распределения могут 
значительно отличаться от распределения Пуассона в силу на- 
рушения этих условий. Например, при плохом перемешивании 


суспензии клеток х; уже не будут независимыми (образование 
«комков» клеток), а à будет варьировать от одного опыта к дру- 
гому. Отклонение эмпирического (экспериментального) распре- 
деления от гипотетического (теоретического) позволяет подчас 
не только обнаружить методические ошибки в проведении опы- 
та, но и вскрыть существование более сложных механизмов, не 
описываемых простыми вероятностными моделями. 

В заключение этого параграфа отметим, что математическое 
ожидание и дисперсия пуассоновского распределения опреде- 
ляются параметром л: 
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Действительно, как мы только что показали, С'(1) = А, 
С” (1) = Ж. В силу теоремы П-6 имеем 


Ех = @' (1) =, 
Dx = G" (1) +0" (1) — [0 (0р = 22-0 2020. 


6 5. БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


Рассмотрим случайную величину — число девочек в семье 
из п детей, принимающую значение 0, если родился мальчик, 
и значение 1, если родилась девочка. Спрашивается, каково pac- 
пределение вероятностей для числа девочек в семье из п детей? 
Эта и многие другие задачи описываются следующей урновой 
схемой, называемой схемой Бернулли. 

В урне находятся черные и белые шары в пропорции р:4 
(0+9 = 1). Каждый эксперимент состоит в случайном после- 
довательном выборе с возвращением п шаров. Каково распре- 
деление (рі, {= 0, 1, 2, ..., п, числа черных шаров? 

Проведем рассуждения, подобные рассуждениям предыду- 
щего парапрафа. Обюзначим х; случайную величину, принимаю- 
щую значение 0, если 7-й вынутый шар белый, и значение |, 


если он черный. По условию задачи Рба- 0} = 4, Р{х; = 1} = 
Количество черных шаров в отдельном эксперименте Дре 


вается суммой х= д + ... + Ха. Так как каждая из х; имеет 
производящую функцию С;(у) = q + ру, то производящая функ- 
ция суммы С(у) в силу обобщения теоремы 11-5 будет 
G (у) = (4 + ру)". Далее, 

О (у) = np (q + ру)", С" (у) = п (п — 1) р? (9 + ру\"?,... 


‚ G® (у) =n (п — 1)... (и k+ 1)p* (9 + pyy. 


Поскольку для любого k = 0, и ҮН / 
п(п-1).. = те а 0% (0) = г ри?! (17 к 
то 


1 за 
Ре ООС аш 


k n! Ж 
где Cr = pin pr ` число сочетаний из п элементов по k. 
ан 
Полученное распределение 
k Е 
Pye Спр 9" i КЕЗЕ; Жа ооо) n, 


называется биномиальным распределением с параметрами p ип. 

Биномиальным распределением описывается широкий класс 
биологических явлений. К биномиальному распределению мы 
обращаемся всякий раз, когда изучаемый объект имеет одно из 


50 


двух значений качественного альтернативного признака — 0 или 
| («да» или «не-да»): семя проросло — не проросло, человек 
здоров — не здоров (болен), окраска крыльев бабочки светлая — 
не светлая (темная), клетка повреждена — не повреждена ит. д. 
Заметим, что биномиальное распределение мы получили в пред- 


положении, что х; независимы и р остается постоянны м. 
Если, например, речь идет 

об инфекционном заболе- 

вании, то альтернативный 04|- Ре 

характер признака от- | 
нюдь не приведет к бино- 
миальному распределе- 
нию: вероятность забо- 
леть разная для челове- 
ка, находящегося и не на- 
ходящегося в контакте с 
больным. 

Вид биномиального 
распределения для р=0,1 
при различных значе- 
ниях п показан на рис. 13. 


Математическое ожида- 


Ж Рис. 13. Биномиальное распределение 
ние и дисперсия случан- при р = 0,1 для некоторых значений п. 


0 4 8 72 76 20 


ной величины х, распреде- 


ленной по биномиальному закону, выражаются через парамет- 
ры рип: 


Ех = пр, Dx = пра. 


Действительно, С'(1) = пр, 6”7(1) = п(п—1)р?. В силу теоре- 
мы П-6 имеем 


Ех = пр, 


Dx = 0" (0) +89 (1) — [C (1) = п(а- Пр | пр — пр? = 
=np (l — р) = пра. 

Укажем на связь между пуассоновским и биномиальным 
распределениями. Оказывается, что при малых р и достаточно 
большом п распределение Пуассона является приближением 
биномиального” распределения (говорят: биномиальное распре- 
деление аппроксимируется пуассоновским), а именно: если р до- 
статочно мало, то 
a ÀF 


k > 
Са! 9%" ~ е м» 


где Л = пр; причем соответствие тем лучше, чем больше п (пря 
одном и том же А). Это следует из того, что производящая 
функция биномиального распределения С (y) равняется 
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аө)-і ру" = 1 ру 0" |16 |. 


Как известно из курса математического анализа, функция 
(1+ Аи)" стремится к е^ при п--оо. Поэтому при п--оо имеем 
С(и)-»еМми-0, что является производящей функцией распреде- 
ления Пуассона. 

Итак, при малых р биномиальное распределение становится 
близким к распределению Пуассона. Однако эти два распреде- 
ления соответствуют разным статистическим схемам. Для пояс- 
нения сказанного рассмотрим производящую функцию G (y), 
общую для пуассоновского и биномиального распределений: 


С (у) = П+м(и— 1]. ... [1 + (0—1). 
Производящая функция распределения Пуассона 
А (у-1) 
е 


и производящая функция биномиального распределения 


[9 + ру]" = [1+ р(у — 1) ]" 
получаются из б (у) при разных предположениях относитель- 


HO №, ..., Àn. Распределение Пуассона получается в предполо- 
жении, что №, ..., Аһ — достаточно малые числа; бино- 
миальное —в предположении, что все А; одинаковы: 
М = А2 = ... № = р, где р — их общее значение. 


Из изложенного следует, что распределение Пуассона и 
биномиалыное распределение хотя и родственны по природе, но 
описывают разные процессы. Распределение Пуассона описы- 
вает сумму гетерогенных событий с малыми вероятностями 
отдельных событий (Ai, А, ..., №). Распределение биномиаль- 
ное описывает сумму однородных событий, но без ограни- 
чения на величину вероятности отдельного события. 


$ 6. ПОЛИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


K биномиальному распределению мы пришли, рассматривая 
урновую схему с шарами двух типов. Однако нередки задачи, 
когда число типов шаров в урне больше двух. Например, нали- 
чие четырех основных групп ‘крови в системе АВО человека 
означает, что изучение их распределения приведет к урновой 
схеме с четырьмя типами ша?ов. 

Рассмотрим общий случай. Пусть в урне находятся шары l 
типов в пропорциях р1:)9:...:р, так что р + ро + 
+...+рі=1. Каждый эксперимент состоит в последователь- 
ном выборе с возвращением п шаров. Какова вероятность иметь 
в данной выборке А, шаров первого типа, Еә-- второго, А, — [-го 
типа (ki + А + ... + А = п)? Обозначим эту вероятность 


Р(Ё,..., В) = Р(х =, Х,=,,..., Ху k). 
52 


По сути дела, это распределение многомерной случайной вели- 
чины (х1, Хә, ..., №). Проводя рассуждения, подобные тем, что 
использовались в $ о при выводе биномиального распределения, 
можно показать, что 


п! k 

КЕСИ женнен l 

Р ур) kıl! Ао. т АИ ра, .. рі 
Такое распределение называется полиномиальным распределе- 
нием с параметрами п, Pi, Ро, ..., рі. Полиномиальное распре- 


деление является обобщением биномиального, последнее можно 
ассматривать как полиномиальное при [ = 2. 

Пример 11-4. При скрещивании гетерозигот Аа вероятности 
появления в потомстве доминантной гомозиготы АА, гетерози- 
готы Аа и рецессивной гомозиготы аа равны соответственно 
р! = 1/4, рг = 2/4, рз = 1/4. Чему равна вероятность того, что 
в семье, содержащей двух потомков, не будет ни одной доми- 
нантной гомозиготъг? 

Обозначим р искомую вероятность и пусть р(Ё, Во, Ёз) -- 
вероятность того, что Рі потомков являются доминантными гомо- 
зиготами, Ко — гетерозиготами и Еҙ-- рецессивными гомозиго- 
тами. Тогда р = р(0,0,2) + р(0,1,1) + р(0,2,0). Въчислим гаж- 
дую из этих ыша 


v (0, 0, 2е- ді 2 теа (1/4)9 (1/2)° (1 4)2-- 1/16; 
р(0, 1, = пто? 00) И (1/4) = 14; 
р(0, 2, 0) = = ТІСІ ти (14 (М9) )? (1/4 = 1/4. 


В итоге р = 1/16 + 1/4 + 1/4 = 9/16. 


Задачи 
11-1. Докажите, что: а) ЕС-С; 6) Е(Сх)-СЕх, в) Е(С--х)-С--Ех, 
где С-- константа. 


11-2. Докажите, что: а) DC=0; 6) D(Cx)=C?Dx; в) D(C+x)=Dx, где 
С-- константа. 


П-3. Докажите, что формулу для дисперсии Ох-Е(х- Ех)? можно за- 


писать в виде Ох=Ех?— (Ех)?. 
П-4. Покажите, что математическое ожидание целочисленной равномер- 


но распределенной случайной величины Ех---(М-81). При этом обратите 
внимание, что 


S=1+2+ ... +(N—1) +N; 
$=М+ (N—1)+... +241. 
11-5. Покажите, что дисперсия целочисленной равномерно распределен- 
ной случайной величины рх= то (N?—1). 
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Для вычисления >! используйте треугольную таблицу: 


1+ 2+ 3+ 4+... + М N.N + 1)/2 

2+ 3+ 4+... + М (Мод. (N — 1)/2 

3+ 4+... + N | (N+3)(N—2)/2 

4 + + N | (N44 (N — 3)/2 

. N | (М-М) (М-М+1)2 
Сумма 
по 

столбцу 1 22 32 Ч. М: 


11-6. Докажите, что для любых двух случайных величин 


Е(хі +2) = Ех +Ех» 


11-7. Докажите, что если х и X2 независимы, то 


О(х+ж) = рх + хо. 
11-8. Докажите, что если независимые случайные величины хі и Хо pac- 
пределены по закону Пуассона с параметрами À; и Аз соответственно, то их 


сумма Х--Хі--Хә также имеет пуассоновское распределение с А- АЛ + Àe. 
1-9. Эксперимент заключается в одновременном подбрасывании 12 nr- 
ральных костей. Если кости симметричные, то вероятность случайного собы- 
тия А--(5, 6} для каждой из них равна 1/3. Определим случайную величину 
как число костей, на которых выпала цифра 5 или 6. Она имеет биномиаль- 
ное распределение с параметрами р=1/3, п=12. В табл. 1 приведены pe- 


Таблица 1 
Распределение результатов 26 306 бросаний 12 игральных 


костей (данные Уэлдона, по В. Феллеру [1967] и М. Кендаллу 
и А. Стьюарту (1966)) (к задаче 11-9) 


Число осуществления Число наблюдений 
события (5, 6) В ОДНОМ 
эксперименте эмпирическос | ожидаемое 
0 185 203 
1 1149 1216 
2 3265 3345 
3 5479 5976 
4 6114 6273 
о 5194 5018 
6 3067 2927 
7 1331 1255 
8 403 392 
9 105 87 
10 14 19 
11 4 1 
12 0 0 


зультаты 26306 таких экспериментов. Постройте графики наблюдаемой в 
ожидаемой функций распределения. Сравните две полученные кривые и най- 
дите их максимальное расхождение. 

П-10. В одной семье все 9 детей — девочки. Найдите вероятность этого 
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события, предполагая, что появление детей разного пола описывается бино- 
миальным распределением с параметрами р=1/2, п=9. 

1-11. При облучении сухих семян гороха гамма-лучами в клетках про- 
ростков регистрировали число поврежденных хромосом (табл. 2). Всего бы- 


Таблица 2 


Распределение числа поврежденных хромосом по клеткам 
проростков гороха, п=1000 (Н. В. Лучник, 1963 г.) 
(к задаче 11-11) 


Число поврежден- Число поврежден- 
ных хромосом Частота клеток ных хромосом Частота клеток 
в клетке в клетке 
0 0,877 | 3 0,007 
1 0,063 4 0,204 
9 0,047 | 5 0.001 
| 6 0,001 


ла проанализирована 1000 клеток. Среднее число поврежденных хромосом 
на клетку равно 0,205. Сравните графически это эмпирическое распределе- 
ние с гипотетическим распределением Пуассона, Х--0,205. 


ГЛАВА ІП 


НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 


В гл. П мы рассмотрели дискретные случайные величины. 
Другой важный класс составляют случайные величины, множе- 
ства возможных значений которых представляют отрезки дей- 
ствительной прямой. Примерами непрерывных случайных вели- 
чин являются масса и размеры особи, диаметр колонии на чаш- 
ке Петри, уровень. активности фермента, количество гемогло- 
бина в миллилитре крови, возраст и т. д. 4 


61. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ 
СВОЙСТВА 


Непрерывная случайная величина х определяется тем, что 
ее функция распределения Ғ(х) ‘имеет следующий вид: 
y 


Р(х) = (04, 


— œo 


где f(x) — неотрицательная функция, называемая плотностью 


распределения вероятностей случайной величины х. Плотность 
полностью определяет непрерывную случайную величину и поз- 


воляет находить вероятность попадания х в отрезок [a,b] по 
формуле 


~ b 
PaL K 9 -- | f(x)dx. 


“а 


Заметим, что вероятность попадания случайной величины х в 
отрезок [a,b] равна вероятности попадания в любой из отрез- 
ков |а,6), (а,5|, (a,b), потому что вероятность попадания в 
любую конкретную точку равна нулю. Последнее утверждение 
следует из предельного соотношения 


— а+А ә 
Ріа<х<а-Ц-)| Қоу4х--тР(х--а)|--0. 


Отметим, что между дискретными и непрерывными случай- 
ными величинами существует явная аналогия. Пусть х — непре- 
рывная случайная величина с плотностью распределения f(x). 
Разобьем интервал (а,5| (рис. 14) на п отрезков длиной А, 


É | 
~ 
| 2 
Г \ | 7 
| 
| 
|| | 
И тч за 
j і | | | | 
; | | | 
? ЕЕ p к а #(х) 
| | | 22 | | | | 
Жаға 1 г. | | 1 
0 а 2A ... кА (ка 5 х 


Рис. 14. Приближение непрерывной случайной величины дискретной 
случайной величиной. 


для простоты примем а = 0. Для каждого из интервалов (0, А], 

(А, 24], ... определим числа ро, Рі, ... как площади построен- 

ных на них прямоугольников, высота которых равна значению 

функции f(x) в серединах отрезков. Например, рь — это пло- 

щадь заштрихованного на рис. 14 прямоугольника: ра = А. (Xr), 

где Xr = Р.А + 4/2 = (Е + 1/2)А. Таким образом, мы имеем 

дискретную случайную величину х’с распределением вероятно- 

стей {pr}, k =0, 1, 2, ... . Поскольку для непрерывной случай- 
v немі дай b 

ной величины х имеем P{a < х <b} = | f(x)dx, то в силу 
определения интеграла 

b п-1 
< 
хах == А) А 
|„Ходахм У 0А) а= У 


п-1 


Ри: 


і--0 
Следовательно, Рахх< Б} = Ра < х <b}. Таким образом, 
дискретная случайная величина х’ служит приближением не- 


прерывной случайной величины х в такой же степени, в какой 
частичные суммы (площади прямоугольников) служат прибли- 
жением интеграла. В пределе, при А->0, построенная нами 


дискретная случайная величина х’ стремится к непрерывной 
случайной величине х. 
Понятия математического ожидания Ех и дисперсии Ох для 
непрерывных случайных величин вводятся следующим образом: 
Р, œ 
Ex=| x f(x)dx; 
— со 
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рў = (5 — Ей =| (х – Ех f(x)dx. | 


Как и для дискретного случая, выражение для дисперсии можно 
‘записать по-иному: 


~ ~ ~ со со 2 
Dx = Ex? — (Ех) = |. xX f(x)dx — Г. х у(х) ах 


Дисперсия характеризует размах 

р? (2) ех изменчивости изучаемого при- 
знака, «ширину» кривой плотно- 
сти распределения. Например, 
на рис. 15 распределение / имеет 
меньшую дисперсию, чем распре- 
деление 2. Из рисунка можно 
также сделать качественный вы- 
Рис. 15. Дисперсия случайной ве- Боаз ны 
личины х; (кривая 1) меньше дис. СЛучайной величины «сосредото- 
персии случайной величины хо Чено» в основном в некоторой 
(кривая 2). окрестности математического ожи- 

дания. Ми вкладываем в сказан- 

ное следующий смысл: вероятность больших отклонений слу- 


EZ ЕТ, 


чайной величины от Ех мала, т. е. Р{|х—Ех| > =} ->0, если 
= >> ОО, 


Приведенные качественные соображения можно облечь в ко- 


личественную форму. Обозначим п = Ех но =V ру Справед- 
лива следующая теорема, которую дадим без доказательства. 

Теорема 1-1 (Теорема П. Л. Чебышева). Для любого 
числа k 


P||x— u| зе <. 
Из этой теоремы следует, например, что при ё = 5 на участке 


от р — 5o до u + 50 сосредоточено не менее (а возможно, и бо- 
лее) 96% значений случайной величины, т. е. 


№53 
у f(x)dx > 0,96. 


Для практически важных типов распределений 96% распре- 
деления сосредоточено в гораздо меньшей окрестности матема- 
тического ожидания — в пределах 26--3с (см. $ 3). Из тео- 
ремы ПІ-І следует также, что при Ох, близком к нулю, распре- 
деление сосредоточено в основном в малой окрестности Ех. 

В ряде случаев в качестве характеристики «центра» распре- 
деления берут медиану Е, которая делит плотность распределе- 


ния на две равновеликие по площади части. Иными словам И, 
для медиапы выполняется соотношение 


Р{х <) =P |x >t] =0,5. 


$ 2. СОВМЕСТНОЕ РАСПРЕДЕЛЕНИЕ И НЕЗАВИСИМОСТЬ 
НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН 


Пусть хі, хг — две непрерывные случайные величины. Мно-: 
жество их возможных значений (элементарных событий) — 
точки плоскости. Любые события представляются геометри- 
чески в виде областей на этой плоскости. В дальнейшем для 
простоты будем одной и той же буквой (например, А) обозна- 
чать и Область, и соответствующее событие, заключающееся в 


том, что двумерная случайная величина х = (хи, Хо) СА. 
Совместная функция распределения Е(хі, X2) двух непрерыв- 


ных случайных величин х, Хо задается плотностью двумерного 
распределения — неотрицательной функцией — только уже двух 
переменных |(х1, хг), такой, что 


Ха aY 
Ғ(х, х) = | | 1 (ti, to) ба. 
-ое-90 
При этом вероятность любого события А, обозначаемая, как и 


раньше, P(A) или Р(хе А), определяется выражением 


Р(хЕА! = || ла, х) ахах, 


v v 


где интегрирование ведется по области А. 
Выясним теперь, как связаны маргинальные распределения 


случайных величин х и хо с функцией f(x, хә). Пусть 


Р{х, < xı} — это вероятность того, что случайная величина Xı 
примет значение, меньшее х!, вне зависимости от того, каким 


будет хо. Следовательно, Р{х < х1} = 2, (xı), где Е, (х) — мар: 
гинальная функция распределения хі. Обозначим |; (х) соответ- 
ствующую плотность распределения хі. Найдем ее: 


Р, (ха) = Р {51 < хи =P|XEA] = | |, У(хь ха) ха ах, = 


= ле, Бава = | ға, оаа. 


Так как һҺ(жх) = ЕЛ(хі), то по правилу дифференцирования 
интеграла получим, что плотность х; равна 


œ 
ЛО) о а. 
Аналогично ПЛОТНОСТЬ распределения Хо равна 


Ла (5) = Г. Л (ха, хо) ах. 


Отсюда сл едует по определению м атематического ожидания, 
ЧТО 


— со со е) 
Ех, = |. х А (x44) бху = в. | ху) (хи, X) ах, dX; 
№ со љ СО » СО 
Ех, = | х } (хз) ах, = | \ Xa f(X X) Кей. 
— со ы —со Ј — со 
Рассмотрим понятие математического ожидания в общем 
случае, Пусть х— случайная величина, являющаяся функцией 
Хр H Хо: х = p (%1, x2). Математическим ожиданием случайной 


величины х называется число 
аъ ғ.” ее) 10 
Е [$ (xı, х)] = | | Ф (х., хә) f (Xis Xə) dX, ах». 
— со и — 00 


Из этого равенства немедленно следует свойство суммы слу- 
чайных величин: Е (ху + Хо) = Ех + Ехо. Действительно, 


Е (ху на Xə) —— | | (х; E У х,) ах, ах, = 


---СО ео 


і Ка х къ 5) ах, ах + 
та | 15 Xo f (ха, Ха) ахах = Ех, T Ех». 


и — < t 


— 


Как следует из гл. І, непрерывные случайные величины X; и 
Xo являются независимыми, если для любых интервалов 
А: = (21,6| и Аә- (a2, 65] условная вероятность Р(жүе-А1/ ес А2) 
не зависит от А, т.е. Р{а <x < bila2 < Хо < Бо) = 
= Ра < я < 01). Пусть |х, Хә) — совместная плотность веро- 
ятности хі и Хо, а (х) и (Хо) — плотности вероятности ху и 


Хо в отдельности. Приведем без доказательства следующую 
теорему. 


~~~ ий 


Теорема П1-2. Непрерывные случайные величины х и X2 He- 
зависимы тогда и только тогда, когда 


(а, Хо) = fı (x1) -f2 (хә). 
Из этой теоремы следует важное свойство независимых слу- 
чайных величин ху и Хо: 


В (xı + x) = Рх, + Рх». 
Действительно, | 


D (i те xa) = Е (х ЕГ х.) [8 (х, T х). 


Имеем 
Ес + хо) = E (X2 4 2x; х, + ©) = Ex? + 2E (x, х,) + Ех. 

Так как 

[E (%1 + №) = |Ех + Ех]? = (Ех,)? + 2 (Ех) (Ех) + (Ех), 
ТО 

Р(х х) = [Е — (Ех + [Е — (Ех. + 
4-2 [E (x, хо) — (Ех) (Ех,)|. 

Первые два члена пр авой части — это по определению Ох 


и хо. Третий член равен нулю, так как хі и Хо независимы 


(см. задачу 111-2). Следовательно, D (x, + хг) = Эх, + Бх.. 
Таким образом, независимые случайные величины обладают 
аддитивным свойством в отношении дисперсии. И в общем слу- 


чае для N независимых случайных величин ху, Хо, ..., Xn будет 
n ге п те 
р роми хі) АЕ 


Выше мы рассмотрели свойства математического ожидания 
и дисперсии для суммы независимых случайных величин. Когда 
случайные величины зависимы, в качестве меры зависимости 


используют ковариацию: Соу (хі, Xa) --Е(( x, — — Ех к) С — Ех.) |. 


Ее можно записать и иначе: Соу (Хі, X) = E (X; х) - (Ex,) (Ех.). 
Последнее следует ‘из преобразований 


Соу (хр хз) = Е [X1 X — x, (Ех) — (Ех) + (Ех) (Ех,) = 
= (х, X3) — (Ех!) (Ех) — (Ех) (Ех) + (Ex1) (Ех) = 
= E (x, хо) — (Ех!) (Еж). 
Если f(x, Хо) — плотность распределения, то 
Соу (хі, Xo) за ПГ. Xi Xo (ха, хә) ах, 4х. — (Ех!) (Ех,). 


„чо 


Смысл ковариации ясен из сопоставления ее с дисперсиями х! и 
Хо, в которых квадрат (х-- Ех)? запишем как произведение 


(х— Ех) (x— Ех): 
Dx, = Е [(х, — Ех, — Еж); 
Dx, = Е (х, — Ех.) (х.— Ех,)|; 
Соу(х,, хз) = E [(х, — Ех.) (х,— Ех). 
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Аналогичным образом можно определить понятие ковариация 
и для дискретных случайных величин. Ковариация (буквально 
«совместная вариация») — это мера совместного варьирования 


случайных величин хі и хо (английские термины variance и со. 
variance лучше отражают общность смысла этих величин), 


Можно сказать, что дисперсия случайной величины х — это ко. 
вариация x c xi Dx = Соу (x, x). 
Введем теперь новую случайную величину 
= _х- Ех 
Үш” 
которую будем называть нормированной случайной величиной, 


Смысл такого преобразования (нормирования) заключается в 
том, что за начало отсчета значений случайной величины бе- 


рется среднее значение Ех, а стандартное отклонение р Ох 
используется как единица измерения. В результате получается 
безразмерная величина, математическое ожидание которой рав- 
но нулю: 

Еу = 0, 
а дисперсия равна единице: 


(см. задачу 111-3). 
Ковариация двух нормированных случайных величин 
х. Ех 12 _ ж— Ехо 
Туя и у; у 
Ох Рхо 
называется коэффициентом корреляции случайных величин х; 
и хг и обозначается как р(х1, хг) или просто р: 


р = Соу (Yis Ye) = Е (у, У) — (Еу!) (Еу) = Е (у, y2) = 
__ Сом (5, х. 
И (рх) (Dx) 
Как и исходные нормированные величины у; и уг, коэффициент 
корреляции есть величина безразмерная, и потому он является 
удобной мерой зависимости (показателем силы связи) двух слу- 


чайных величин. Его значения по абсолютной величине не пре- 
вышают единицы: 


—1 <р<1 
— и достигают + | или —1 лишь при наличии линейной за- 
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висимости между величинами хі и Хо. Если случайные величины. 
независимы, то р = 0; это следует из того, что при независи- 


мости Cov (xı, хг) = 0. Надо подчеркнуть, что обратное утверж- 
ление в общем случае неверно: равенство нулю коэффи- 
пиента корреляции еще не означает независимости случайных 
величин. Однако для биометрических задач очень важно, что 
обратное утверждение справедливо в случае двумерного 
нормального распределения (см. $ 6). 

Дисперсия суммы зависимых случайных величин выра- 
жастся через коэффициент корреляции: 


аша ВОС ОА), 
покажем это. 
Ех, = ЕО ОХ, х, F АЙ == Ел Ехі--2Е (ху). 
далее, 
[Е(х, + хо) = (Ех, + (Ех) + 2 (Ех (Ех), 
откуда 
р(х, + ха) = Епа) — [E (%1 + 6) 8 = [Е — (Ех + 
+ [Е — (Ех) +2 [E (X; Xa) — (Ех) (Ех.)] = 
= Dx, + Ох, + 2 Cov (х,, Хо). 


А так как Cov (хі, х)) =p И (раз (Ох,), то требуемое равенство" 
доказано. 


83. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


Рассмотрим следующую статистическую модель. Пусть хи, 


X2, ..., Xn — Очень большое число независимых дискретных 
случайных величин, каждая из которых может принимать рав- 
новероятно одно из двух значений: — и е. Выясним, как рас- 
пределена случайная величина х, являющаяся суммой случай- 
ных величин Xi: х = + № +... + Ха. 

Если (п/2 +) случайных величин х; приняли значение е, 
а остальные (0/2 — k) приняли значение --е, то случайная Be- 
личина х примет значение х = p + дей, где р — математическое 
ожидание х. Иначе говоря, для того чтобы х приняла значе- 

х —– и 

ние х, нужно, чтобы k = = я 
кона вероятность зтого будет 


В силу биномиального за- 
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п! 1 \л 
Ре = 09 Ел (а? -- R)! (z) . 


Если (n/2 + k + 1) случайных величин приняли значение в 
а остальные (п/2--Е--1) приняли значение --е, то случайна 


величина х примет следующее по величине значени 
х = р + 28 + 2e, большее х на 2e. Вероятность этого равн 


ии n! 1 \п 
Рен (по + k 1) (0/2 — 1)! Е 7) ` 


Отношение вероятностей ри! и Ph равно 


Рьы (2 +A (012—0) а 
pe ПЕНИ (12 = 1) 
— (U2 жау (912—0) во Мо тов 
(|2 +А+ 1)! (n2 + k)! (пі2--Е--Іі) С па + 8 + 1? 


а относительный прирост вероятности равен 


APk _ Pk — Pk Рен | "k 242 Atl 
PR PR Prk n2+k+1 пі2-БЕ-БІ” 


Если п велико, то очевидно, что случаи, когда А = 0 или 
близко нулю, а также случаи, когда k = п или близко п, доста- 
точно редки; их вероятности близки нулю. Поэтому для про- 
стоты рассмотрим случаи, когда Е значительно больше нуля, но 
значительно меньше п, т. е. 0ОЖЕ п. Тогда 


БИИР 


PR 
Величина 
— __ Рем — Pk 
Ар, = Рен — рь = (k T 1) — k ?’ 
р а 
следовательно, приближенно равна производной 2га ‚ если 


рһ рассматривать как функцию непрерывного аргумента k. 
Отсюда имеем 

а | 

Рв — Арп. 


Решим это уравнение, полагая его точным: 
а k 
Г Е Л 
Ра п 
откуда пра = —2k?/n + іп С, где С — произвольная константа. 
Следовательно, 
-283/п 
Ра == Ce , 
х--һ 
или, заменив # на Рот И обозначив значение pr через f(x): 
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f (x) = Се 02", 
Константа С определяется из условия нормировки: 


а00 


| f(x) dx= 1. Из курса математического анализа известно, 
-2 


^ со (01.290? — 1 
что \ егет” 4х = ѕ Ут, откуда С=—= . Таким образом, 
— ОО 2 ү 4- 
плотность распределения случайной величины х имеет вид 
| — (20—922)? 
X) = — e ы 
Р(х) = су | 


где p и с — параметры распределения. Это распределение назы- 
вается нормальным, или гауссовым (рис. 16, 17). Выше мы 


пи 
р-46 р-39 р29 ps H +6 р+25 +36 +46 


Рис. 16. Плотность нормального распределения. 


Можно видеть, что f(x) положительна, одновершинна, с максм- 
мумом при хе p и асимптотически стремится к — о и +0. 
Кривая имеет две точки перегиба: при x= 9-0 и хе 1+5; она 
симметрична относительно перпендикуляра, опущенного из вершины 

на ось абсцисс. 


ввели ц как математическое ожидание х, далее будет показано, 
что о? есть дисперсия х, а о — его среднее квадратичное откло- 
нение. 

Описанная нами модель является частным случаем более 
общей ситуации. Может быть сформулировано и доказано 
утверждение (центральная предельная теорема), которое в не- 
строгой форме звучит следующим образом. 

Если случайная величина х представляет собой сумму боль- 
шого числа взаимно независимых случайных величин, влияние 


каждой из которых на всю сумму ничтожно мало, то х имеет 
распределение, близкое к нормальному. 
Нормальное распределение занимает центральное место в 
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теории математической статистики и в ее биологических при- 


ложениях. | 
Почему статистические модели, основанные на нормальном 


распределении, находят широкое применение в биометрии? 
В значительной мере, по-видимому, потому, что в биологии 
очень часты ситуации, близ- 
кие к условиям центральной 
4 кен кекке алын = предельной теоремы. Значе- 
ния различных признаков, 
учитываемых биологом, есть 
реализация длительного и 
сложного пути их становле- 
ния на клеточном, организ- 
менном, популяционном или 
биогеоценотическом уровнях 
| организации жизни. Про- 
| цесс формирования призна- 
| 2 ка включает множество от- 
po p23 ро р ро рео ро носительно простых дейст- 

вий, каждое из которых 

подвержено массе случай- 

Рис. 17. Функция нормального рас- ных, разнонаправленных 

пределения. флуктуаций. 

В самом деле, для многих количественных, или мерных, 
признаков (например, рост, масса, количество определенного 
продукта и т. п.), могущих принимать непрерывный ряд значе- 
ний, их распределения близки к нормальному. Это подтверж- 
дает анализ фактических данных в больших (несколько тысяч 
наблюдений) выборках. Например, на рис. 18 показано выбо- 
рочное распределение по росту 8585 взрослых мужчин. Налицо 
хорошее согласие эмпирического распределения с теоретиче- 
ским нормальным распределением. 

Когда распределение количественного признака отличается 
от нормального, внимательный анализ выборки позволяет вы- 
явить и устранить причину расхождений, нередко заключаю- 
щуюся в неоднородности исходного материала. На рис. 19 при- 
ведены результаты известных опытов В. Иоганнсена, из кото- 
рых в генетике возникло представление о «чистых линиях». 
Распределение массы 598 бобов фасоли явно двухвершинно. 
Однако автору удалось показать, что это является следствием 
неоднородности — генетической гетерогенности — популяции, CO- 
стоящей из нескольких «чистых линий». Дальнейший анализ 
показал, что внутри «чистых линий» распределение признака 
нормально. 

В других случаях, когда материал несомненно однороден, но 
распределение признака отличается от нормального, с помощью 
надлежащего преобразования шкалы измерений можно прийти 
к нормальному распределению. Иногда вид такого преобразо- 
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Рис. 18. Распределение 8585 взрослых мужчин по росту 
(Дж. О. Юл, М. Дж. Кендал, 1960 г.). 


Кружками показаны эмпирические данные, непрерывная линия — 
плотность соответствующего иормального распределения. 
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Рис. 19. Распределение массы бобов фасоли в опытах 
В. Иоганнсена [Ван дер Варден, 1960]. 


Двухвершинность является следствнем того, что исходный 
материал представляет собой смесь иескольких «чистых линий», 
для каждой из которых характерно нормальное распределение. 


вания можно получить, исходя из некоторых эвристических 

рассуждений. Пусть, например, известно, что рост и ряд других 

промеров распределены по нормальному закону, а масса рас- 

пределена не нормально. Поскольку масса (х) — это, грубо го- 

воря, произведение трех линейных размеров, то можно ввести 
3 


новый признак Ух, который должен быть ближе к HOP- 
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мально распределенному, чем исходный. Практически так и по 
лучается. Часто используют также логарифмическое преобра. 
зование: вместо значений х анализируют log x. 


$4. СВОЙСТВА НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 


1. Поскольку |(х) — плотность распределения, то для лю. 
бого u и любого o > 0 


со 1 ое 23 
| ашшы их, 
— со б У 2r 
По сути дела, это было введено в статистическую модель, когда 
мы провели нормировку, выбирая значение константы С. Такиу 
образом, 


Ф (ху ее 


в ос ИЗ 
— функция нормального распределения. 
2. Если х— М (p; о) (читается: случайная величина х рас 
пределена нормально < параметрами u и о), то 
Ех = ш; Рх = е? 
Докажем это. По определению 


ра: 1 „99 (еп 27953 
Ех = (” х(жах---- КР) хах. 
f Г ) G И |a 
Сделаем замену переменных у = (х— и) /в. Тогда 
па 1 2 СО у? на 
а | ое+ве ду = 
Ѕ > --у:2 1 99 үй) 
=== е “а = | за ду = 
ИЯ | y+ e ТЕТІ Ей y 
б А — 2/2 9 / ы — у, 2 г? 
= — е ду”, = — -- е Преса 
Е ст |. yi2 + p т —_ + = 
Далее, 
РНЕ су | (ве ах 
За g? œ 2 02 4 = 5 г —y? 2 9 2 ЖИ? 
ИДС егет ы ау” 


с: R --ү:9 
------- де Да 
ү?х | > 


3. Очевидно, что по аналогии с другими непрерывными pac- 
пределениями 


5 2.002 
| те dx = Ф (b) — Ф(а). 


7 
” / Әт 
пада 


4. При рассмотрении теоремы 1Ш-1 отмечалось, что для He- 
которых типов распределений характерна более тесная группи- 
овка значений случайной величины вокруг математического 
ожидания, чем в общем случае. На рис 70 можно видеть, что 
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Рис. 20. Плотность нормального распределения со средним значе- 
нием p и дисперсией 02. 


Цифры означают процент площади, занимаемой данной частью pac- 
пределения. 


68,27% нормального распределения сосредоточено в окрестности 
иФо; 95,45% — в окрестности р + 26; 99,73% — в окрестности 
u + 36. 

5. Вследствие симметрии нормального распределения 


Ф(х) -1--Ф(-х). 


6. Функция Ф(х) не выражается через элементарные функ- 
ции, поэтому ее вычисление будет вызывать каждый раз техни- 
ческие трудности. Однако выход из положения очень прост: 
нормальное распределение с любыми р и о можно свести с NO- 


— и 


-% 


мошью уже использовавшейся замены переменных и-- 
к Ф(и): 
X- 


1 ji — и? 972 
\ e"? Чи = 
— оо 


сИ 2- 


x \2 202 
Ф (х) = - Вы | е РР = 
1 ли — 12,0 
же t = Ф М 
УЕ Ja е 4 (и) 


Очевидно, что новая случайная величина и ~ М (0; 1), ее обозна- 
чают как нормированное нормальное распределение. Это чет- 
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ная функция, т. е. (и) = (-и), симметричная относитель 
оси ординат. Поэтому 


1 0 —u?? 1 
— е И = —— 
үт ІШ 4 И * 


fiu) Таким образом, дост 
точно вычислить таблиц 
для функции нормир 
ванного нормального рас 
пределения Ф(и), чтоб 
вычислять Ф(х) для нор 
мального распределени 


ее) 
—u? 2 ке 2 
| е ди = 5. 
0 


“ с произвольными u и 
w a a aT l 1 ? 3 4 (см. рис. 21, 22 и табл. |] 
Приложения). 


Рис. 21. Плотность нормированного 


Приведем, наконе 
нормального распределения. 


без доказательства следу 
ющую важную теорему 


0 и -и 0 


Рис. 29. В разных статистических таблицах и учебниках биометрии 
интеграл нормального распределения может даваться при разных пре- 
делах интегрирования. 

Функция нормального распределения, пределы интегрирования: а — от --20 


до и (см. табл. ІІ Приложения); б —от 0 до и; в —от—и до и; г — удвоенный 
интеграл от — © до —u (или от и до œ). 


Теорема Ш-2. Пусть хі, х;,..., Х,-- независимые HOP- 
мально распределенные случайные величины с параметрами 
(ы, 5), (рә, °,),..., (в 5,) соответственно. Случайная вели- 
чина 


x =at a, xt... На, хь 
70 


будет тогда распределена нормально с параметрами (и, с), где 


роза а м |... С дара 
а-та? -.. „ас 


Рассмотренные свойства нормального распределения частично 
уже разъясняют, почему это распределение занимает централь- 
ное положение в теории математической статистики. Дополни- 
тельные аргументы будут приведены в $ 5 ив $ 8 этой главы. 
Однако полностью ситуация станет ясной лишь после прора- 
ботки всего курса. 


$ 5. АППРОКСИМАЦИЯ БИНОМИАЛЬНОГО И ПУАССОНОВСКОГО 
РАСПРЕДЕЛЕНИЙ НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ 


Упомянем, наконец, еще одно обстоятельство, связанное с ши- 
роким использованием в биометрии нормального распределения. 
Выше уже отмечалось, что качественные альтернативные при- 
знаки нередко имеют распределение, близкое к биномиальному 
(5 5 гл. ІІ), а редкие события часто описываются распределе- 
нием Пуассона ($ 4 гл. П). 

Пример 11-1. В большой популяции, состоящей из десят- 
ков тысяч особей, имеются особи с темной и светлой окраской 
в равном соотношении. Из популяции извлекается случайная 
выборка в 100 особей. Какова вероятность того, что число 
темноокрашенных особей будет не меньше 45 и не больше 55? 
Налицо урновая схема с р = д = 1/2 ип = 100. Число темно- 
окрашенных особей в выборке — это реализация случайной ве- 


личины х, распределенной по биномиальному закону. Един- 
ственное отступление от этой схемы — невозвращение отловлен- 
ных особей в популяцию, однако отловленная часть (100 осо- 
бей) столь мала по сравнению с численностью всей популяции, 
что можно пренебречь этим отклонением от схемы выбора 
с возвращением. Искомая вероятность 


, ~ 55 100! (3 
р! ЕЕ а = У Z 
Р 45 < х а 55} = y Рі = в 45 (100 — А)! ki ЕН 


45 


Очевидно, что найти все члены этой суммы технически сложно. 
С подобными вычислительными затруднениями сталкиваются и 
при анализе распределения Пуассона. Хотелось бы как-то упро- 
стить вычисления. 

Справедливы следующие утверждения относительно пуассо- 
новского и биномиального распределений: 


1. Пусть случайная величина х распределена по закону 
Пуассона с параметром А. Тогда при лоо 


Р(а<х<8|ғ-Ф(ш)-Ф(ш)), 
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b— А + 0,5 а—^\ — 0,5 | 

где Из == =; и = . Обычно эту аппрокси 
у ^ 

мацию используют при À` 9, | 


~ 


2. Пусть случайная величина х распределена по биномиаль. 
ному закону с параметрами р ип. Тогда при п->со 


Р(а< х < 02 Ф (и,) — Ф (и), 
Б — пр + 0,5 а пр 0,5 , 
----; l = — =. Эта аппроксимация при. 

И пра У прд 
меняется обычно при кра > 9. 

Константы --0,5 и —0,5 в приведенных выше формулах 
улучшают аппроксимацию дискретного распределения не. 
прерывным и называются поправками на дискретность; 
естественно, ими можно пренебречь при больших п. 

Следует, однако, подчеркнуть, что эти аппроксимации спра- 
ведливы асимптотически. При небольших значениях параметров 
\ и п указанные приближения могут быть очень неточными. 

Используя полученные результаты, обратимся к решению 
примера 111-1. 

Пример 111-1 (продолжение). Имеем ирд = 100. + . + == 
= 25 > 9, следовательно, утверждение 2 применимо. В силу 
этого имеем пр=50, Упрд = 5, откуда Р(45 <х<55} ғ 
ж Ф(и2) — Ф(ш), где из = 1,1 и ш = —1,1. Из табл. II Прило- 
жения находим Ф(1,1) = 0,864; Ф(—1,1) = 0,136. Следова- 
тельно, вероятность того, что число темноокрашенных особей 


в выборке объема 100 находится в пределах от 45 до 55, равна 
Р = 0,864 — 0,136 = 0,728. 


$ 6. ДВУМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 


где й» == 


Аналогично одномерному случаю можно ввести плотность 
двумерного нормального распределения. Несмотря на некото- 
рую сложность, вернее, громоздкость последующих выкладок, 
обсуждение возникающих здесь вопросов крайне важно в связи 
с очень частыми в биометрии задачами изучения корреляции и 
регрессии. 

Получим вначале выражение плотности двумерного нормаль- 
ного распределения для независимых случайных величин 


Ху И хо, плотности которых суть 


-- 1 — (ri-n)? 20? | „\ — | - (05 —109)2/222 
А (х!) е и (Хо) е | 


o И 2z с. V 27 
По теореме 111-2 плотность их совместного распределения будет 


Л (хи, Хо) = fi (x1) Ja (x) = 


1 Им мт)? | /х?-- вой 
пакета) НЕТ) 
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Вид функции f(x, хг) показан на рис. 23. Поверхность, опи- 
сываемая функцией Қо, хә), имеет колоколообразную форму; 
вершина — максимальное значение — отвечает значениям Хі-- ш, 
хо = p2 Линии f (xi, х) = С, образованные пересечением по- 
верхности [(х1, №) с плоскостями, параллельными х10хг, пред- 


ЕЕ Е 

Е Р БЕ! таа ъс 

Е А = о 2, 
Е SUS 


Рис. 23. Певерхность, описываемая плотностью двумерного нормаль- 
ного распределения независимых случайных величин х; `и Хо [Sokal, 
Rohlf, 1969]. 
ставляют собой при разных С вложенные друг в друга эллипсы 
(так называемые контурные эллипсы) с центром (шъ, и2) и OCA- 
ми, параллельными координатным осям (рис. 24). Действи- 

тельно, уравнение (х, Хә) = С эквивалентно уравнению 


Е = ay ЕВ (== = е == — 9 In (2x 0, o С). 


“1 


Tı 
p161 H2S; и |: р+2 61 мі; 


> 


Рис. 24. Контурные эллипсы для двумерного нормального 
распределения независимых случайных величин [Хальд, 
1956]. 


Из аналитической геометрии известно, что общее уравнение 
эллипса, не обязательно параллельного координатным осям, 


с центром в точке (ui, рг) описывается с учетом дополнитель- 
ного члена 


Хр В Хә - #2 
6] бо 


с произвольным коэффициентом. Поэтому в общем случае плот, 
ность нормального распределения случайных величин хү И х, 
можно задать в следующем виде: 


А _ во: 
f (Xi, Xə) == ё Ы 


БЕРІЛІСІ 


где 


X] ны ay + С Xi 1 Хо — о | ГА» — пол? 
о- (=) рса (аты) 
| \ 


— так называемая квадратичная форма переменных хр и Хо, 
константа А > 0. 


Пока еще неопределенные константы А, В и С следует вы. 


брать так, чтобы f (X1, Хә) являлась плотностью, т. е. потребуем 
выполнения условия: 


1) Г. | ла хлйх ах. 7, 


| 


Потребуем также, чтобы параметры о: и 0. , как и раньше, 
являлись дисперсиями соответствуюших случайных величин: 


27 Их Ва. 


12 


Рис. 25. Поверхность, описываемая плотностью двумерного нормаль- 
ного распределения коррелированных случайных величин, о = 0,9 — 
ср. рис. 23 |5оКа!, Rohlf, 1969]. 
И, наконец, константы А, В и С должны быть такими, чтобы 
3) Соу(х), Хо) = ро, з. 
Из этих трех условий можно получить выражения для иско- 
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мых констант, откуда следует формула для плотности двумер- 
ного нормального распределения 


(х1, х») 9- с, 6; ГЕ 

1 (хұ-- ма) (х, — Ayes (хо — и)? 

< exp |-зата | p 2 а 2) р 2 Ак! |}. 
1 j 59 
где ехр 2 = ег. 
В 62 говорилось, что 
для случайных величин, S 
распределенных нормально, $ p=0 І 
равенство коэффициента 26, р«03 Ж 525 
корреляции нулю означает У, ХХ 
независимость случайных БК! \ 
величин. Действительно, реа 
если в приведенном уравне- р: | EA 
=0,9 


нии положить р=0, то плот- 1 ( р:0, 
ность совместного распреде- Рр? 9: N ( >ө:0% 
~ ра [NO 
ления Хі и хз равна произ- ругс, X 2? 1,00 
ведению плотностей марги- | 
нальных случайных вели- - е 
ЧИН, 726, pró ра реб р? 29, 
На рис. 25 показана по- 


верхность (х1, хг) при р = Рис. 26. Контурные эллипсы для двумер- 
= 0,9 и тех же самых o? ного нормального распределения, 01=02 


а [Хальд, 1956). 
H С , что и на рис. 23, где Можно видеть, что с увеличением 0 во0з- 
р = 0. Оси контурных эл- растает эксцентриситет эллипса; при p= | эл: 
липс вырождается в прямую. 
липсов при р = 0 не парал- 
лельны осям координат. При фиксированных о! и оз зксцент- 
риситет эллипса — его форма — определяется значениями р 


(рис. 26). 


$ 7. РАСПРЕДЕЛЕНИЕ 2 


Многие задачи биометрии сводятся к задачам следующего 
типа. Имеются независимые нормально распределенные слу- 


чайные величины Хі, Хо, ..., Ху с математическими ожиданиями 
ui и дисперсиями 0? (і--І, 2, ..., у). Каково распределение 
новой случайной величины 

“ ив) > 

жш, | 2; 


Поскольку каждая из величин и, = 


распределена нор- 
L 
мально с параметрами 0 н | (см. $ 4 этой главы), то задача 
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Xi— Hi 
б; 


ставится таким образом: найти распределение случайной вели- 
ЧИНЫ 


ши... ия, 


где независимые случайные величины U; ~ М (0; 1). Эта задача 
была решена в 1900 г. английским статистиком Карлом Пирсо- 
ном, нашедшим плотность и функцию распределения, которое 
он назвал х2-распределением (хи-квадрат). Единственным 
параметром распределения хи-квадрат является число степеней 
свободы у. 

Мы не будем рассматривать в дальнейшем вопросов, в кото- 
рых использовались бы вид плотности и функции распределе- 
ния х2. Кроме того, для разных значений у имеются таблицы 
(см. табл. У Приложения). Поэтому дадим лишь качественную 
характеристику плотности. Поскольку величина х2 не отрица- 
тельна, то это распределение сосредоточено на полуоси [0, оо). 
При v = 1, 2 плотности ;27-распределения монотонно убывают, 
при у>2 это унимодальные асимметричные кривые (рис. 27, 
28). Асимметрия уменьшается с увеличением у, и при доста- 


Р(х?) 
0,20 =] 


\2= 20 


2025 30 35 40 


Рис. 27. Плотность х: -распределения при разном числе степеней 
свободы у. 


точно больших у (порядка 100) распределение y? аппроксими- 
руется нормальным распределением (вновь нормальным!) с ма- 
тематическим ожиданием у и дисперсией 2v. Аппроксимация 
еще лучше для преобразованной случайной величины 


И 952 ~N (VKT, 1). 


Поэтому случайная величина 


и=(И 27 Ум (0; 1). 
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Рис. 28. Плотность х2-распределения при v = 5. 


Цифры указывают процент площади, занимаемой данной частью распре- 
деления. 


Из определения х2 следует важная теорема. 


Теорема 111-4. Если x? , Х,..., ха — независимые слу- 
чайные величины, имеющие распределение х2 с числом степе- 
ней свободы соответственно Vi, V2, ..., Уһ, ТО случайная вели- 
чина 


7922221 72 Гә 
зу оче 

распределена также по закону х2 с числом степеней свободы 
у = ү tyv t ... FVR. 


5 8. РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА 


Наряду с нормальным и х2-распределением часто встречается 
иное распределение, являющееся комбинацией двух указанных. 


Пусть u~ М(0; 1) и 2 — случайная величина, распределенная 


по закону х2 с числом степеней свободы у. Если и и 72 незави- 
симы, то распределение отношения 


ғ” 


и 
УТ 


называется распределением Стьюдента, или #-распределением. 
Единственный параметр этого распределения — число сте- 
пеней свободы у. Оно также табулировано (см. табл. ПІ Прило- 
жения). 

Распределение Стьюдента симметрично относительно оси 
ординат (его математическое ожидание равно нулю). Вид рас- 
пределения показан на рис. 29. При достаточно больших у (прак- 
тически при у> 30) распределение Стьюдента аппроксими- 
руется нормированным нормальным распределением. 


t= 
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Рис. 29. Плотность #-распределения при разном числе степеней 
свободы V. 


‚ ‘t -распределение аппроксимируется нормирован- 
ным нормальным. 


Когда Уу -> со 


$ 9. РАСПРЕДЕЛЕНИЕ СНЕДЕКОРА — ФИШЕРА 
Рассмотрим, наконец, еще одно важное распределение, встре- 


чающееся в биометрии. Пусть y? их, — независимые случай. 


ные величины, имеющие распределение y? с числом степеней 
свободы у; и уз соответственно. Тогда случайная величина 


И УІ 


Е= 


~ 


2 
197; Y2 


Рис. 30. Плотность Е-распределения. 
В скобках указаны значения числа степеней свободы >; H Ys. 
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имеет распределение Снедекора — Фишера, или Ғ-распределе- 
ние. Это распределение в отличие от %?- и [распределений имеет 
два параметра: число степеней свободы числителя и число 
степеней свободы знаменателя. Из определения следует, 


что случайная величина |/Р также имеет Ғ-распределение, но 
с числом степеней свободы уг и vı. Общий вид Е-распределения 
показан на рис. 30. Оно табулировано (см. табл. ТУ Прило- 


жения) ы 


$ 10. ВЗАИМОСВЯЗИ МЕЖДУ РАЗЛИЧНЫМИ 
РАСПРЕДЕЛЕНИЯМИ 


Выше неоднократно говорилось о предельных переходах 
между распределениями, об аппроксимации одного распределе- 
ния другим. Было показано, что дискретные распределения, 
такие, как биномиальное и пуассоновское, при определенных 
условиях достаточно точно аппроксимируются непрерывным 
нормальным распределением ($ 5) и что распределение Пуас- 
сона есть предельный случай биномиального распределения 
(гл. П, 6 5). , 

Укажем еще два важных соотношения между дискретными 
(биномиальным и пуассоновским) и непрерывными (Е и yx? co- 
ответственно) распределениями, которые выполняются точно. 


1. Если случайная величина х имеет биномиальное распреде- 
ление с параметрами р и п, то она связана со случайными BE- 


личинами Е, и Е, соотношениями 
Рика =1- РИ <>) 
(п — А) + #+)-А 


Ра >k =1 Р «р, 
[+ (п = 2+1): Р, 


где Ё, — случайная величина, имеющая Е-распределение с na- 
раметрами уц--2(е + 1) и у2=2(п — k), а случайная величина 
Е, имеет Ғ-распределение с параметрами у = 2(п— Е + 1) и 
Vvo = 2R. 

Отсюда следует, что для вычисления вероятностей Р{х < k} 


и P{x > k} можно использовать значения функции Е-распреде- 
ления, которое, как уже говорилось, достаточно подробно табу- 
лировано (табл. [У Приложения). 


2. Если случайная величина х подчиняется распределению 
Пуассона с параметром ), то она связана со случайными вели- 


чинами хо H% соотношениями 
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где х2 имеет распределение y? с параметром у= 2(А + |), 


а yg имеет распределение y? с параметром у= 28. Это озпачает, 


что для вычисления указанных вероятностей можно использо. 
вать таблицы распределения y? (табл. У Приложения). Указан. 
ные свойства будут использованы нами в дальнейшем (гл. V, 
$5иб). 

Основные взаимосвязи между различными распределениями 
изображены на рис. 31. Видно, что нормальное распределение 
занимает особое положение, являясь пределом (в смысле тео- 
рии функций) всех рассмотренных нами распределений. 


Полиномиальное 
распределение 


Биномиальное 
распределение 


Распределение 
Пуассона 


Норма льное 
распределение 


распределение 


Рис. 31. Взаимосвязи между распределениями. 


Рядом со стрелками указаны условия предельных переходов 
или взаимно-однозначных соответствий. 
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Задачи 


ПІ (Иллюстрация центральной предельной теоремы). Постройте rpa- 
ви распределений трех случайных величии: 1) числа очков, выпадающих 


Т подбрасывании одной нгральной кости, 2) суммы очков на обенх костях 
и подбрасывании двух и 3) суммы при подбрасыванин трех игральных 


костей. РЕ 5 
11-2. Докажите, что для х H х› — двух независимых случайных вели- 


чни — Е (x12) = (Ех) (Ехо). 5 

11-3. Докажите, что Еу=0 и Dy=1, где y — нормированная случайная 
величина. | D 

-4. Пусть (0) = т | е 

ІП усті (х) Изи 
в) Ф(2). Е за | т 

Ш-5. Пусть и ~ М (0; 1). Найдите: а) P \— 3< u<2j; 6) Р|- | <их< 09), 

— ~ я. / — 

в) pilules i; г) Р(а| <2); n P [|u] =3}; е) РЦ а |> 3]. 


11-6. Пусть и-“М (0; 1) u Ри <ү}=В. Найдите у при В, равном: 
а) 0,90; 6) 0,95; в) 0,99. 


111-7. Пусть х М (1; 2). Найдите Р(—3<х<7. 

111-8. Пусть хо М (4; 2). Найдите Р{19х—7|>2}. 

111-9. Пусть хр № (0; 2) и ха (1; 1). Найдите Р-4<«х--хо<8). 

111-10. Пусть Хі--М (3; 3) и х--У (0; 4). Найдите Ро +2x2—3| > 8}. 

11-11. Пусть x~ М (2; 5) и P{|x|<y}=0,95. Найдите y. 

11-12. Докажнте, что ЕХ (у) = у, Ох 2». Указание: сначала докажите, 
что Exa) =! н Ох) =2. | Е 

11-13. Пользуясь табл. У Приложения, найдите: а) Р{у2>27,0}, у= 9; 
6) Р(57<0,004), у= 1; в) Р(Х7%>5,23), у= 15. 

111-14. Пользуясь табл. ІП Приложения, найдите: а) Р(Е>-2,20), у= 11; 
б) Ге? 20) у= 11; в) РИ <ү)-0,95, у=7, y=? г) (Р| И <ү)-0,99, v=7, 
ү: 

111-15. Пользуясь табл. ГУ Прнложсния, найдите: а) Р({Е» 17,12}, у =6, 
„=4; 6) Р(Е>13,18), у= 15, у=4; в) Р(Ғ>13,18), у,=4, у= 15. 


111-16. Пусть |(х) — плотность распределения случайной величины х, 
такая, что для псе существует точка симметрии хо, т. е. для любого а>0 


ев Найдите: а) Ф(0); 6) Ф(—1); 


Кю-а) =|(хо—а). Тогда Ех-хо, б=х. Что можно сказать о нормальном 
распределении? 


6 Зак. № 122 


«Если Эксперимент — Король 
Наук, то Статистические Методы ~ 
fi его Телохранители». Е 


М. Трайбу; 


ГЛАВА IV 


СТАТИСТИЧЕСКИЕ ЗАДАЧИ В БИОЛОГИИ 
И ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ 
СТАТИСТИКИ 


Предыдущей главой завершено вероятностное введение в 
биометрию. Теперь мы приступим к рассмотрению основ мате- 
матической статистики. Начнем с постановки некоторых наибо- 
лее часто встречающихся статистических задач, которые возпи- 
кают в биологии при проведении количественных эксперимеитов 
и наблюдений. В процессе ознакомления с этими задачами бу- 
дут сформулированы основные понятия математической стати- 
стики. Еще раз подчеркнем то, о чем уже шла речь во Введе- 
нии: количествепное исследовапие начинается с организации зк- 
сперимепта, включающей и выбор адекватных методов, с NOMO- 
шью которых затем будет производиться анализ результатов. 


$ 1. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА 


Понятия генеральной совокупиости и выборки являются па- 
чальными, основополагающими понятиями математической ста- 
ТИСТИКИ. 

Рассмотрим урну, содержашую / шаров, из которых Ма по- 
мечены цифрой 0, №, — цифрой 1, ..., №, — цифрой г. Обозна- 
чим р: = ММ долю шаров, помеченных цифрой i: р; >0, і=0, ..., 
... Г; ро... +p:= 1. Из этой урны проведем п-кратный выбор 
наугад по одному шару с возвращением. В результате получим 
выборку объемом п шаров, содержащую n; шаров, помеченных 


цифрой i: 1= 0, ..., г; п: 20 (в случайной выборке некоторые Mi 
могут быть равны нулю!); по+ ... + пол. Обозначим р, + пп 
долю шаров в выборке, помеченных Г: p; 220, Ола 
Pit ... +p, =1. Зная состав урны (№, ..., №), можно найти 


вероятность того, что будет получена выборка данного состава- 
Pino: вом ии 
По отношению к различным возможным выборкам урна, со- 
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оржашая М шаров, ‘является“`генеральной совокупностью. По- 
нятия генеральной совокупности и выборки оказываются, таким 
образом, понятиями соотносительными: бессмысленно TO- 
орить O совокупности п шаров, что это выборка, без указания 
на то, откуда выбрана данная совокупность, из какой урны, из“ 
какой генеральной, общей совокупности; бессмысленно гово- 
ить, что урна дашого состава есть генеральная, общая COBO- 
күппость, без указания на то, для каких выборок эта совокуп- 
ность является генеральной. Связью, создающей отпошения ме- 
жау геперальной совокупностью и выборкой, служит проце- 
дура вы бора шаров: в рассматриваемом случае это после- 
довательный выбор шаров наугад с возвращением, который да- 
„ее будет называться простым случайным выбором. 

° Пример 1У-1. У 245 юношей— студентов университета с 
точностью до 1 см измерялся рост — важнейший антропометри- 
ческий показатель (табл. 3). Требуется охарактеризовать гене- 


“Таблица 3 


Результаты антропометрического измерения юношей — студентов университета 
(к примеру 1У-Г) 
СЕ ЕО СС СС С С С С ЖИВЕЕ ааа оина ааваа аа 
Рост, см; выборка объема п--245 


ОЕ ИЕН ИЕ ОЕ Ч СИТИ БЕТТИ ТИТ ---------------------- 


174 | 168 | 167 | 181 | 171 | 182 | 178 | 170 | 178 | 170 | 169 | 170 | 170 
177 | 169 | 168 | 178 | 172 | 175 | 177 | 174 | 183 | 174 | 173 | 168 | 171 
193 | 175 | 180 | 168 | 175 | 154 | 167 | 172 | 178 | 173 | 159 | 178 | 172 
192 | 180 | 168 | 170 | 181 | 182 | 184 | 192 | 173 | 168 | 178 | 182 | 169 
196 | 180 | 158 | 178 | 165 | 185 | 170 | 180 | 193 | 173 | 167 | 183 | 174 
177 | 170 | 17 180 | 165 | 181 | 165 | 180 | 185 | 161 | 181 | 179 
182 | 168 | 172 | 180 | 185 | 164 | 186 | 184 | 170 | 174 | 178 | 159 
146 | 173 | 177 | 173 | 188 | 164 | 162 | 170 | 170 | 173 | 167 | 173 
175 | 160 | 178 | 175 | 185 | 156 | 170 | 187 | 170 | 170 | 170 | 170 
182 | 182 | 178 | 164 | 188 | 170 | 168 | 170 | 180 | 165 | 168 | 169 
181 | 170 | 180 | 175 | 170 | 173 | 179 | 183 | 174 | 174 | 192 | 176 
176 | 168 | 173 | 163 | 166 | 172 | 167 | 193 | 162 | 174 | 190 | 201 
181 | 169 | 177 | 176 | 166 | 169 | 180 | 185 | 180 | 173 | 172 | 174 
175 | 173 | 173 | 176 | 168 | 177 | 172 | 174 | 184 | 170 | 180 | 189 
178 | 162 | 172 | 168 | 192 | 178 | 155 | 162 | 187 | 178 | 178 | 170 
173 | 165 | 177 | 175 | 180 | 177 | 169 | 172 | 170 | 157 | 179 | 178 
180 | 165 | 173 | 165 | 178 | 167 | 172 | 167 | 183 | 167 | 199 | 178 
183 | 150 | 169 | 180 | 179 | 173 | 175 | 175 | 194 | 171 | 196 | 182 
173 | 15 178 | 17 177 | 181 | 180 | 190 | 185 | 160 | 175 | 183 
179 | 162 | 167 | 173 | 173 | 172 | 189 | 169 | 176 | 165 | 179 | 176 


ральную совокупиость, из которой извлечена выборка. 

Генеральная совокупность в этом примере — множество всех 
юношей — студентов данного упиверситета, составляющее не- 
сколько тысяч человек. Выборка — те юноши, у которых изме- 
рялся рост; объем выборки п равен 245. 

Главная задача, которую решает математическая статистика 
(ради чего, собственно говоря, эта наука и существует), заклю- 
чается в том, чтобы па основапии изучения выборки сделать вы- 
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воды о свойствах генеральной- совокупности. Выборка — лищ 
часть генеральной совокупности. Поэтому выводы о генерал 
пой совокупности, которые делают на основании изучения ву. 
борки, могут иметь лишь вероятностный характер. Мы ана 
лизируем выборку для того, чтобы по ее свойствам вывести за 
ключение о свойствах генеральной совокупности. При этом на 
не интересует индивидуальная характеристика каждого обсль 
дуемого, в статистической задаче речь идет о массовой ха 
рактеристике совокупности. і 


Если сначала, собирая материал, исследователь шел от ге 
неральной совокупности к выборке, то цель анализа состоит у 
переходе от свойств выборки к свойствам генеральной совокуп, 
ности. Последний шаг в статистической модели возможен толь. 
ко в том случае, если первый шаг в организации эксперимент; 
был сделан правильно, если правильной была процедура взятия 
выборки. В этом учебном пособии мы рассматриваем лишь про. 
стейший метод взятия выборки — простой случайный выбор 
Если в примере ІУ-І действовать по аналогии с урновой схе. 
мой, то надо было бы «пронумеровать» всех студентов, затен 
случайно, папример по жребию, извлечь последовательно с воз. 
вращением 245 номеров и измерить рост соответствующих сту. 
дентов. Подробнее о такого рода процедуре говорится в 8 3 


Пример 1У-2. Этот пример демонстрирует нарушение условий 
простого случайного выбора. Пусть требуется охарактеризовать 
рост студентов университета. В качестве выборки, изучение ко 
торой позволит сделать заключение о признаке в генеральной 
совокупности, предлагается взять баскетбольную команду уни. 
верситета. Абсурдность такого подхода очевидна. 


Впервые систематическое внимание на приемы организации 
простого случайного выбора стал обращать английский матема: 
тик и биолог Р. А. Фишер в 20-е годы нашего столетия при пла: 
нировании и анализе полевых экспериментов на Ротамстедской 
сельскохозяйственной опытной станции. Был проведен ряд опы: 
тов, паглядио показавших, что процедура выбора, основапная 
па субъективиом представлении исследователя о «типичности» 
выбираемых объектов, не обеспечивает зачастую выполиепия 
условий простого случайного выбора. Один из этих опытов, опи: 
санных сотрудником Фишера Ф. Иейтсом в 1935 г., заключался 
в следующем. 

Пример 1У-3 (Ф. Йейтс, по В. H. Перегудову, 1961 г.). Про: 
изводилось обследование высоты растений яровой пшеницы в три 
срока: 31 мая, 14 июня и 28 июня. Цель обследования — устано- 
вить интенсивность роста растепий. Брались 32 пробы, в каждой 
по 8 растений. Растения отбирались двумя способами: а) слу- 
чайпым образом — от края делянки отступали на 25 см и H3- 
меряли ближайшее растение; б) определялась высота типичного 
(с точки зрепия исследователя) растепия в том же рядке. Ре- 
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ұльтаты показали систематические различия между двумя спо- 


собами формирования выборки (табл. 4). 


Таблица 4 


Средняя высота растений яровой пшеницы (см) при двух способах 
формирсвания выборки (к примеру 1У-3) 


—- 
Случайная Отбор «типичного» | | 
Лага измерения выборка образца Отклонение 
ото И Т я се цагтытынанаалыа 
31 мая 47,49 50,82 + 3,33 
14 июня 76,56 78,29 +1,73 


28 июня 115,84 | 116,12 — 2,72 


Из таблицы можно видеть, что в первый срок при низкой 
высоте растений наблюдатели стремятся ее «подтягивать»; в 
последний срок, когда растения достигали большой высоты, по- 
является склонность не доверять этому факту. Заметим, что 
средний прирост различается почти на 10%: 118,84—47,49 = 
=71,35 см при случайном отборе и 116,12--50,82--65,30 см при 
отборе типичного образца. 

Субъективизм экспериментатора особенпо четко проявляется 
в другом, модельном опыте. 

Пример ІҮ-4 (Ф. Иейтс, по В. H. Перегудову, 1961 г.). На 
стол положили 1200 камней различных размеров и массы. Было 
предложено 12 лицам (каждому трижды) отобрать 20 камней, 
«типичных» для этой совокупности. После каждого испытання 
камни возвращались обратно и перемешивались, так что все 
наблюдатели и каждый из пих при повторном отборе паходи- 
лись в одинаковых условиях. Результаты приведены в табл. 5. 


Таблица 5 


Средняя масса камней (унции *) при отборе серий по 20 камней 
(к примеру ГУ-4) 


Наблюдатель 


Повторность 11 
ЕЗ? |4 о [о Іт |в |о | ю|фи 12 
1 | 1912221. 10125 294 24| 161 921 Зол-2а | 2,4 
2 Ера у Е, Әр о 
3 Ш 24 [2.1 2а | Заров | 25| zo! g2} ЗА | 18 | 24 
| А аты | т туа | | т | 
Среднее. . | 1,5 | 3,6 | 2,3 | 90) | И ЖОЛ” | ОЭ и 
| | | i | | i 
“1 унция =28.35 г. 


Средняя масса всех отобрапных камней равна 2,34 унции, 
тосная средияя масса всех камней — 1,91 унции, т. е. в целом 
участники эксперимента увеличили среднюю массу камней при- 
мерно па 25%. Обратите внимание, что только у 2 испытуемых 
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из 12 средняя масса оказалась ниже истинной, у остальн 
10 — выше. Более интересно, пожалуй, то, что испытуемые явь 
проявляют «определенные склонности»: первый, папример, с 
стематически занижает результаты, четвертый твердо держу 
ся на уровне среднего, девятый вообще не показывает изменчь 
вости от опыта к опыту и т. д. Как заметил один статистик, чь 
ловек — удивительно плохой инструмент для сознательного осу 
ществления случайной выборки. 

Правда, в целом ряде случаев, особенно в медицинских. 
сельскохозяйственных опытах, при проведении экспериментов 
природе осуществить случайную выборку бывает пе так просто 
Это требует тщательной организации: опыта. 

Не следует думать, что в каждой биометрической задаче все 
гда четко и.одпозначпо очерчена, генеральная совокупность 
Можно спорить, .папример, точно ди очерчена генеральная сово 
купность в, примере ГУ-1: кто-то будет толковать ее как совокуц 
пость юношей — студентов всех университетов такого-то регио 
на, кто-то — всей страны, а кто-то’— как совокупность студенто 
вссх вузов. В рассматриваемом ниже примере ІУ-8, где объекта. 
ми исследования являются белые крысы, вряд ли кто будет на 
стаивать, что генеральную совокупность составляют разводимы 
сегодня во всех лабораториях мира все белые крысы. При изу 
чепии морфологии краба Pachygrapsuş crassipes (см. приме 
LV-17) также, наверное, не идет речь о всех особях вида, бис 
лог-профессионал введет какие-то. ограничения на возраст. жи. 
вотных, условия их обитания. ит, д., и т. п. Постановка подоб. 
ных вопросов, подчас очень. важных, — дело биологов соответ. 
ствующих специальностей. При построении статистической мо 
дели конкретизации понятия «генеральная совокупность» не тре 
буется. 

«Понятие бесконечной генеральной совокуппости не является 
логически безупречным и необходимым. Для решения статисти: 
ческих задач нужна не сама генеральная совокупность, а лишь 
те или иные характеристики соответствующей функции распре. 
деления F(x). С точки зрения теории вероятностей выборка из 
бесконечной генеральной совокупности представляет собой на: 
блюдаемые значения нескольких случайных величин, имеющих 
заланный закон распределения».* 

Генеральная совокупность, таким образом, задается как 


некоторая генеральная случайная величина х, имеющая функ: 
цию распределения Ғ(х), которая может быть известна или не 
иззестна исследователю. При таком подходе простой случай- 
ный выбор состоит в п-кратном повторении случайного испыта: 
ния, математической моделью которого является случайная ве: 


ms 


личина х. Ипыми словами, простой случайный выбор дает 


* Большев Л. Н. Генеральная совокупность. — В кн. Математиче: 
ская энциклопедия. М., Советская энциклопедия, 1977, т. 1, с. 918. 
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п-мєрную случайную величину (х, х, ..., Xn), каждая компо- 


пепта Xi которой имеет функцию распределения Ё; (х), совпа- 
дающую с функцией распределения F(x) случайной величи- 


ны х. Из определения простого случайного выбора следует пеза- 


висимость в совокупности случайных величин х, ..., Ха, ЧТО NO- 
зволяет записать фупкцию их совместного распределения: 


Ве Е 


При этом конкретные значения Xi, ..., Xn, регистрируемые эк- 
сперимептатором, рассматриваются как реализации случайных 


роличип Хі,..., Ха. К 

Бернемся к примеру ТУ-1. Разобраться в 245 беспорядочно 
асположенных числах довольно трудно, поэтому упорядочим 
их по возрастанию выборочных зпачений — вариант: 


146<150< 154 ... 196 = 196<201. 


Так“ю упорядоченную последовательность пазывают ранжиро- 
ванным рядом: Е 


Ха) < Хо 4... [L Ха), \ 


где новый индекс (в скобках) есть порядковый номер (ранг) 
варианты в этом ряду. Поскольку некоторые варианты имеют 
одинаковые, совпадающие значения (например, 158, 160 и т. д.), 
бывает удобнее представить данные в виде вариационного ря- 
да — таблицы, один стол- 

бец которой содержит зна- 70-%(ж) 

чепия вариант х, а в APY- 

гом столбце числа п; пока: 08 


зывают, сколько раз вари- г / 
апта встречается в выборке 06- 
(табл. 6). По ранжирован- - l 


пому ряду можно построить 04- , 
| 


функцию Ғ,(х)--й(х<х)). 1 

По аналогии с генеральной 02 2 

функцией распределения ` 

F(x) естественно назвать а 40% 
Ға(х) выборочной (змпири- 80 60 170 180 190 200 


ческой) функцией распреде- 
ления; для примера IV-I рис 39. Рост юношей — студентов 
опа представлена графиче- университета. Эмпирическая функция 
ски на рис. 32. распределения. 

Теперь, наконец, мож- | 
по поставить вопрос, который, наверное, уже возник у вдумчи- 
вого читателя: на каком основании, собственно говоря, мы MO- 
жем рассчитывать на то, что вариационный ряд, выборочная 
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функция распределения Ё. (х) дают информацию о гепераль 
ной совокупности, т. е. функции распределения F(x)? Строги 
ответ на этот вопрос содержится в замечательной теореме, до, 
казанной советским математиком В. И. Гливенко в 1933 г. По, 
ле некоторых предварительных рассуждепий мы сможем сфор. 
мулнровать теорему, правда, в более слабом виде, чем это сдь. 
лал ее автор. 


Таблица ( 
Вариационный ряд роста студентов, п-- 245 (по данным табл. 3) 


Рост (2;), Число Рост (х;), Число Рост (х;); Число 

м студентов (л ) см студентов (а ) см студентов (а) 
----------------- 
146 1 165 9. 184 3 
147 0 166 2 185 6 
148 0 167 8 186 1 
149 0 168 12 187 2 
150 1 169 11 188 2 
ІБІ 0 170 24 189 1 
152 0 171 2 190 3 
153 0 172 и 191 0 
154 1 173 19 192 4 
155 0 174 10 193 3 
156 1 175 l4 194 1 
157 ] 176 6 195 0 
158 2 177 9 196 2 
159 0 178 19 197 0 
160 3 179 5 198 0 
161 2 180 17 199 0 
162 5 181 7 200 0 
163 1 182 7 201 1 
164 3 183 6 


Мы строили выборочную функцию распределения Ё, (х), 
используя конкретные числа X1, ..., Xn. Поэтому в каждой точке 
х функция Ё. (х) дает числовое значение у= Ё. (х), зависящее 
от чисел Xi, ..., Ха как от параметров: у--у(Ххі, ..., Ха). Одна- 
ко выборку (хі, ..., Ха) мы договорились рассматривать в ка- 
честве реализации случайного вектора (х1, ..., Ха). Подставляя 
в функцию /--у(хі,..., Ха) вместо числовых параметров Хі,..., 
Ха случайные величины х], .. Ха, получаем вместо числа 
у=у(Х,... Ха) случайную величину у--/(Хі,..., Ха), ДЛЯ KOTO- 
рой число У--/(хі,..., Ха) есть просто одна из возможных реа- 
лизаций. Итак, наряду с выборочной функцией Ё, (х) с чисто- 
рыми параметрами х,..., Xn мы получаем случайную выбороч- 


ную функцию Ё. (х) со случайными параметрами хи, ..., Ха. 
Случайная функция Ё, (х) сопоставляет аргумепту х уже не 
число, но случайную величину Е, (х). 
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Поскольку Ға(х) есть для каждого х некоторая случайная 


величина, то случайной величиной будет и паибольшее расхо- 


ждение Dn между выборочной и генеральной функциями pac- 
поеделения: 

Бр | 
D, = sup (х) — F (x)|. 


fi 


Для случайной величины Dn можно говорить о вероятности CO- 


бытия {р <), где ғ#>0). 


Теорема ІҮ-І (Теорема В. И. Гливенко). Пусть Ё. (х) есть 
случайная выборочная функция распределення, построенная по 


случайной выборке (хі, ..., Ха) из генеральной совокупности, 
описываемой функцией распределения А (х). Тогда для любого 
>0 в любой точке х имеет место соотношение 


Р{0, < є} = 1, 


П >» О 


где Da=sup | Fn (х) —F (x) |. 


Про случайную выборочную функцию распределения Ё. (х) 
говорят, что она сходится по вероятности в любой точке х к ге- 
неральной функцин распределения Е (х). 

Если функция Р(х) непрерывна, то можно найти предель- 


ное распределение величнны Па. Соответствующая теорема при- 
надлежит А.Н. Колмогорову (см. гл. УП, 64) н занимает такое 
же положение в теории математической статистики, как цен- 
тральпая предельная теорема ($ З гл. HI). 


$ 2. АНАЛИЗ ОДНОЙ ВЫБОРКИ 


Вернемся к примеру 1У-1. Задача в примере сформулирова- 
па следующим образом: охарактеризуйте генеральную совокуп- 
ность, из которой извлечена выборка. Это значит, что нужно 


пайти вид распределения генеральной случайной величины х 
и параметры этого распределения. Вначале надо сформули- 
ровать гипотезу о виде распределения, а затем прове- 
рить ее. 

любое предположение о виде распределения случайной Be- 
зичрны или значении ее параметров пазывают статистической 
гипотезой. Каковы предпосылки для формулировки статистиче- 
ской гипотезы о виде распределения? Гипотеза формулируется 
па основании некоторых общих соображений о характере T- 
знака, структуре эксперимента; на осповании аналогичных эк- 
спериментов, выполненных ранее; наконец, на основании апалн- 
за материалов данного эксперимента. Что мы имеем в примере 
ГУ-1? Рост студентов — это количественный признак, а выше го- 
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ворилось, что количественные признаки часто распределены нор. 
мально (см. гл. ІП, $ 3). Ранее приводился также пример поч. 
ти идеального согласия распределения мужчин по росту с нор. 
мальным распределением (см. рис. 18). Обратимся, наконец, к 
материалам нашей выборки. 

Полезно представить имеющиеся данные графически, постро. 
ив выборочное распределение, являющееся апалогом плотности 
распределения f(x). Для этого, однако, нельзя непосредственно 
воспользоваться вариационным рядом: число значений х; для 
дапиого объема выборки п слишком велико, что видно хотя бы 
из обилия нулей и едипиц в графе п,-Табл. 6. Каким образом 
следует сгруппировать данные, объединяя соседние значения -в 
классы? Какое выбрать число классов? Какие значе- 
пия х; выбрать в качестве границ классов? На эти Bonpo- 
сы пельзя дать одпозпачный ответ. Часто пользуются эмпирн- 
ческим правилом: оптимальное число классов лежит между Be- 
личинами Гаш =1-+3,22 еп и ах үп. 

На рис. 33 в виде гистограммы представлены результа- 
ты группировки данных примера IV-l в десять классов: 146— 


„ 030} 
| 


Частота 
<> 
N 
O 


> 
со 


148,5 160, * 172.5 184,5 196,5 т, см. 


7 


Рис. 33. Рост юпошей — студентов университета. Выборочное распреде- 
ление в виде гистограммы. 


Выборка разбита на 10 классов. Основание каждого прямоугольника — это 
длина классового интервала, высота — частота соответствующего класса; таким 
образом, площадь прямоугольника пропорциональна доле соответствующего 

класса в выборке. 


151, 152—157 см ит. д. Середины классовых интервалов равны 
148,5; 154,5 см и т. д. Высота столбиков на гистограмме пропор- 
циональна относительной частоте классов в выборке. Можно ви- 
деть, что выборочное распределение куполообразное, одновер- 
шинное, более или менее симметричное. Следовательно, выбо- 
рочное распределение дает самое грубое, глазомерное представ- 
ление о виде распределения генеральной совокупности (ср. зада- 
чи ГҮ-І, ГУ-3, ГУ-4). В случае примера IV-1, суммируя приведен- 
ные выше соображения и результаты, изображенные на рис. 33, 
можно сказать, что формулировка гипотезы о том, что признак 
«рост юношей — студентов университета» распределен нормаль- 
по, представляется вполне разумной. Теперь можно перейти к 
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следующему этапу решения задачи—проверке этой статистиче- 
ской гипотезы. | 

Проверка статистических гипотез - один из 

азделов математической статистики. 

-Проверяемая гипотеза называется нулевой гипотезой и 000- 
значается Но. В примере ІУ-І Но: случайная величина «рост 
студентов университета» имеет нормальное распределение. В ре- 
зультате проверки нулевой гипотезы может быть получено согла- 
сне с ней, и тогда нулевая гипотеза будет принята. Может, од- 
пако, оказаться, что эмпирические результаты не согласуются с 
гипотетическнми. В этом случае нулевая гипотеза должна быть 
отвергнута и будет принята некоторая альтернативная (конку- 
рирующая) гипотеза Н,. К такому исходу статистического aha- 
лиза пужно быть готовым заранее, поэтому H, формулируется 
одновременно с Но. Конкурирующая гипотеза H, в примере 
А -| гласит: случайная величина «рост студентов университета» 
пе распределена нормально. 1 

Для того чтобы выяснить, справедлива ли Но, нужен какой- 
то статистический критерий, или критерий значимости. Построе- 
пием критериев значимости для решения различных биометри- 
ческих задач мы будем заниматься в последующих главах. 
Здесь же рассмотрим некоторые общие принципы построения 
кр"териев значимости и интерпретации полученных результатов. 

Конструктивная формулировка нулевой гипотезы сопровож- 


дается построением некоторой случайной величины g, являю- 
щейся функцией величин Xi, Хо, ..., Ха. Функция g (х, ..., 


ха) выбирается таким образом, чтобы закон ее распределения 
был полностью определен, т. е. заданы и вид распределения, и 
его параметры. Эта функция строится в предположении пра- 
вилъпости Но и называется статистикой критерия значимости. 
Ее значение беп (Хі,..., Ха), вычисленное по выборочным дап- 


пым, рассматривается как единичная реализация g. Тогда oka- 
зывается возможным вычислить вероятность Р одного из собы- 
ТИЙ: 


Р |2 > АЕА 
Р(2< ба] 
НИ ИХ объединения: 


P {E < Baren} + P {E > сока), 


какого именно — зависит от формулировки альтернативной гипо- 
тезы Н). 

Если Р достаточно велика, больше некоторого о, то 
Но принимают; если Р слишком мала, меньше а, то Но 
отклоняют и принимают альтернативную гипотезу. В этом смысл 
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критерия значимости. Вероятность а называют уровнем значимо- 
си статистического критерия. 

Выбор величины о — задача ис математическая, но био. 
метрическая. Шуточный пример Н. В. Лучника разъясняет 
суть дела. Некий изобретатель обращается с предложением к 
медикам. Он изобрел повое средство против рака, которое эф- 
фективно на самых последних, неизлечимых на сегодня стадиях 
заболевания, накануне смерти; приняв этот препарат, больной 
с вероятностью 0,95 поправляется, но с вероятностью 0,05 умн- 
рает. Можно ли в такой ситуации пренебречь вероятностью 0,05? 
Несомненно! Окрыленный успехом, изобретатель предлагает еще 
один препарат — теперь против гриппа, наносящего, как изве- 
стно, огромный ущерб экономике. Больной, принявший этот пре- 
парат, с вероятностью 0,95 поправляется немедленно, но с веро- 
ятностью 0,05 умирает. Можно ли в такой ситуации пренебречь 
вероятностью 0,05? Разумеется, нет! 

Таким образом, выбор уровия значимости определяется важ- 
постью биологических выводов, которые должеи сделать экспе- 
риментатор. Принятие же решения (выбор о) в обычных, рядо- 
вых ситуациях осповывается на всем опыте развития количест- 
венной биологии. Вначале биометрики брали а = 0,0027, это так 
называемое «правило трех сигм»: можно пренебречь долей пло- 
щади под нормальной кривой, удаленной по обе стороны от 
среднего значения более чем на три средних квадратичных от- 
клонения (см $ 4 гл. ПІ). Накопление материала в разных 66- 
ластях биологии показало, однако, что при этом слишком часто 
припимастся неверная нулевая гипотеза. На следующем этапе 
брали уровень значимости а = 0,05. Однако сейчас создается впе- 
чатление, что при этом слишком часто неправильно отвергают 
нулевую гипотезу. Поэтому в настоящее время многие биометри- 
ки склоняются к следующему правилу: 

а) если Р>>0,05, то припимается пулевая гипотеза; 

} если Р<0,01, то нулевая гипотеза отклоняется и прини- 
мастся копкурируюшая; 

в) если 0,01<Р<0,05, то результат считается неопределен- 
ным, 

В последнем случае обычно требуется проведепие дополни- 
тельных опытов. Однако биолог вправе, учитывая всю совокуп- 
ность знаний по изучаемому вопросу, все-таки принять то или 
нлое решение. Оп может это сделать и берет па себя ответствен- 
пость за этот шаг, по должеи помнить при этом, что уровень 
значимости критерия есть вероятиость ошибочного отклонения 
гулевой гипотезы. 

Обсуждая пример ТУ-1, мы сформулировали представление 
с проверке статистических гипотез и ввели некоторые важные 
понятия этого раздела математической статистики. Теперь He- 
обходимо подобрать к экспериментальным данным гипотетиче- 
скос (теоретическое) нормальное распределение. Однако у нас 
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нет никаких априорных соображений о значении параметров и 
н о этого распределения! И нет другого пути, кроме оценки па- 
аметров гипотетического нормального распределения по вы- 
борочным данным. 
Оценка параметров распределения — другой 
аздел математической статистики. 
Для оценки параметров распределений также используются 
статистики, т. е. случайные величины, являющиеся функциями 


от случайных величин 06(х,..., Хи), реализация которых 
2(х,.-» Ха) наблюдается в эксперименте. 
Для оценки одного и того же параметра генеральной совокуп- 


ности могут быть использованы разные статистики. Например, 

ан Ex 6 ся aa 7 | да д K 
оценкой Ех могут быть и т= = Риахь из (Хшах—Хшш). Как 
правило, они не будут равпы. Какую же статистику следует 
предпочесть? 


Прежде всего «хорошая» статистика &(хи, .:., Xn) должна 
сходиться к «истинному» генеральному параметру п, для оценки 
которого она служит, т. е. для любого в>0 должно выполняться 
соотношение 

4” 


Р (| (ха ен ха) | <= а. 
п - 00 


Оценки, удовлетворяющие этому условию, называются состоя- 
тельными. 
Состоятельность является довольно слабым требованием и к 


тому же описывает поведение случайной оценки 6 (х1, ..., Ха) 
при безграничном увеличении объема выборки. Для выборок ко- 
нечиого объема важиой характеристикой является несмещен- 
ность, под которой понимают выполпепие соотношения 


Е е (хі, 444 % х,) | = 1. 


Две несмешенные оцепки могут обладать разным рассеяни- 
ем вокруг истинного значения параметра n. В качестве меры это- 


го рассеяния естественно выбрать дисперсию О[8 (хи, ..., Ха) |. 


Отсюда следует определение: статистика р(Х, ..., Ха) называ- 
стся эффективной, если ее дисперсия минимальна в классе 
всех несмещенных оценок. | 

Найденные с помощью статистик оцеики параметров явля- 
ются точечными оценками, т. е. определяемыми одним числом. 
Как говорилось выше, статистика есть случайная величина, по- 
этому отдельное ее значение, полученное в опыте, как правило, 
не будет совпадать со значением параметра. Особенно больши- 
ми могут быть различия между значениями статистик и пара- 
метра при малых выборках. Поэтому возникает вопрос: нельзя 
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ли:на основании выборочных данных указать интервал, заклю- 
чающий в себе оцениваемый параметр генерального. распреде- 
ления? Речь идет, таким образом, о нахождении интервальной 
оценки параметра, т. е. оценки, определяемой двумя числами— 
концами интервала. | 

Выберем некоторую большую вероятпость |—@, считая ее 
настолько близкой к единице, чтобы возможностью появления со- 
бытий, вероятность которых меньше о, можно было практически 
пренебречь. Назовем эту вероятность 1--о доверительной Bepo- 
ятностью. Тогда иптервал (а, а2), построенный на основании 
выборочного значения статистики и покрывающий с вероятно- 
стью 1--о значение параметра генеральной совокупности, назы- 
вается доверительным интервалом. Обычно в биологических ис- 
следованиях принимают 1-ағ-0,95. Однако в более ответствен- 
ных ситуациях приходится брать |—о = 0,99 и даже 1—о = 0,999. 

Рассмотрим еще несколько примеров анализа одной Bhl- 
борки. 

Пример ІУ-5. После действия колхицина на растепия земля- 
пики получены ягоды, имеющие массу (г): 1,2; 1,3; 1,8; 1,4; 1,5; 
1,3; 1,4; 1,5; 1,8; 1,7; 1,2; 1,3; 1,4; 1,8; 1,4. Каково средпее значс- 
ние признака у земляники при воздействии колхицином? 

Речь идет о количественном признаке. Однако объем выбор- 
ки мал: п--15. Анализ вида распределения здесь проводить 
трудно. Остается: 1) или предполагать, что распределение нор- 
мальное, 2) или считать распределение произвольным. В пер- 
вом случае нужно получить точечные оценки ци о, а также HH- 
тервальную оценку и (интервальная оценка о в задаче не тре- 
буется!). Во втором случае можно найти точечную оценку меди- 
аны Си ее доверительный интервал. Способ решения этих задач 
будет указан в следующей главе. 


Пример 1У-6 (данные Стьюдента, по P. А. Фишеру [1958]). 
Производился подсчет дрожжевых клеток в счетной камере 
(табл. 7). Согласуется ли полученное распределение с распре- 
делением Пуассона? 


Таблица 7 


Распределение числа дрожжевых клеток по квадратам счетной камеры 
(к примеру ІУ-6) 


Число | Число | Чрсло 
ji | 
дрожжевых квадратов | дрожжевых квадратов | лрожкжевых квадратов 
камеры И камеры | камеры 

П! . 
и 

1 29 | 5 7.) | 9 10 

2 з рб 580014000 с 

3 8 | 7 37 j nN 2 

4 86001006 ву 1 2 
il | 


С какой целью проводятся эксперименты такого рода и по- 
чему. представляет интерес решение указанной статистической 
задачи? В исследованиях по физиологии и генетике микроорга- 
низмов, В различных производственных экспериментах зачастую 
встает вопрос об оценке числа клеток в культуре; это может по- 
требоваться для характеристики темпа размножения клеток, для 
оценки частоты вновь возникающих мутаций и т. д., ит. п. До- 
статочио точное определение числа клеток возможно лишь в 
том случае, если можно учесть каждую клетку отдельно (не об- 
уазуетея комков клеток) и если клеточная культура гомогенна. 
Как это установить? Берется некоторый небольшой объем взве- 
си и помещается в счетную камеру. Нас интересует распреде- 
дение дискретной (целочисленной) случайной величины: число 
клеток в квадрате счетной камеры может быть равно 0, 1, 2,... 
Если по объему взвеси клетки распределены независимо и если 
vyer числа клеток в квадратах счетной камеры ведется точно, 
то мы оказываемся в условиях задачи, рассмотренной в $ 4 
гл. П. Там было показано, что такая случайпая величина долж- 
на быть распределена по закону Пуассона. Таким образом, ре- 
шение задачи о согласии наблюдаемого распределения с распре- 
делением Пуассона дает ответ па вопрос о том, удовлетвори- 
тельна ли техника проведения эксперимента, производится ли 
подсчет числа клеток в культуре методически чисто. Разуме- 
ется, для полного ответа на вопрос необходимо провести иссле- 
дование повторных проб разными лаборантами; однако это 
усложпение задачи мы обсудим несколько позже (см. гл. УП). 

Итак, мы имеем эмпирическое распределение целочисленной 
случайной величины. Решение задачи сводится к нахождению 
оцсики т параметра À, вычислению гипотетического распреде- 
ления и проверке согласия эмпирического распределения с гипо- 
тетическим. Можно пайти и доверительный иптервал для À. 

Пример 1У-7. При рассадке черенков томатов с использова- 
инем кипетипа из 2417 черепков укорепился 561. Какова эффек- 
тивпость этого способа укоренения? 

В качестве меры эффективности укорепения примем 
561/2417- 0,232, или, в процентах, 23,2%, Какова изменчивость 
выбранного показателя? Имеем качественный альтернативный 
призпак «черенок укоренился» — «не укоренился»; если черен- 
ки для опыта выбирались более или менее одипаковыми по 
биологическим показателям и если все они одинаково обрабаты- 
вались кинетином, то вероятность укорепения одна и та же 
для всех черенков. Заметим, что если бы результаты опыта бы- 
ли приведены подробнее — материал был бы разбит па субвы- 
борки по их размещению в теплице или по повторным во вре- 
мени экспериментам, — это предположение можно было бы про- 
верить! Естественно предположить, что укоренения разных Ye- 
ренков — события независимые. В таком случае мы оказываемся 
в условиях схемы Бернулли, приводящей к биномиальному рас- 
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пределению случайной величины «число укоренившихся черен. 
ков» ($ 5 гл. II). Один параметр распределения известен: 
п = 92417. Возникает задача точечной н интервальной оценки па. 
раметра р. 


$ 3. СРАВНЕНИЕ ДВУХ ВЫБОРОК 


Перейдем к рассмотрению задач, возникающих при сравне- 
HHH двух выборок. 

Пример ІУ-8 (по Дж. У. Снедекору [1961]). Исследовалось 
влияние содержания белка в диете на прибавку массы белых 
крыс (табл. 8). Достоверна ли полученная в опыте разница 
между средними прибавками массы? 

Таблица 8 


Прибавка массы белых крыс в возрасте между 28 и 84 днями жизни 
при разном содержанин белка в диете (к примеру ІУ-8) 


Содержание белка Число Средняя 

в диете животных Прибавка массы, г прибавка, г 
Высокое ...... f 146, 119, 161, 113, 129, 83, 123 121,9 
НИЗКое ц ыт ы ъа 7 70, 118, 101, 85, 107, 132, 94 101,0 


Начнем с обсуждения организации эксперимепта. Целью ис- 
следования является изучение действия одпого фактора — содер- 
жания белка в диете. Поэтому, естественио, экспериментатор 
стремится организовать опыт так, чтобы сравниваемые группы 
животных отличались только по исследуемому фактору; 
по всем же другим условиям опыта группы должны быть если 
не идентичны (это идеальная ситуация), то по крайней мере 
практически сходны. Наша книга — пособие по биометрии, по- 
этому «за кадром» остается огромная работа, которую прово- 
дит специалист, готовя такой эксперимент. 

Решается вопрос о выборе материала: что означает термин 
«белые крысы»? Исходя из целей исследования и реальных 
возможностей, экспериментатор выбирает или животных опреде- 
ленной генетической линии, или гибридов первого поколения ме- 
жду линиями (что может иметь свои преимущества), или, нако- 
нец, просто «беспородных» животных. Необходимо так органи- 
зовать разведение животных, чтобы к пачалу эксперимента бы- 
ло нужное число крыс определенного возраста. В примере пе 
оговорено, велось ли исследование на самках или самцах, огра- 
пичивалась ли какими-то пределами масса животных в начале 
эксперимента (28 дней жизпи) и т. п. Не описаны и условия 
эксперимента на интервале 28-й -- 84-й дни жизни животных, ко- 
торые также должны быть одинаковыми для обеих групп: пеле- 
постью было бы содержание животных одной группы в индиви- 
дуальных клетках, а животных другой группы — по 3—4 в клет- 
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ке. Подразумевается, паконец, что взвешивание животных в на- 
чале и в конце эксперимента проводится в соответствии с приня- 
тыми методическими требованиями. 

Обсуждая биометрические задачи, мы всегда предполагаем 
наличие профессиональной культуры при проведе- 
ини соответствующего эксперимента. Без этого просто нет смыс- 
ла обсуждать биометрические задачи. 

Однако даже если эксперимент организован профессиональ- 
но грамотно, возникает следующий принципиально важпый во- 
прос. В нашем распоряжении 14 животных, равноценных во всех 
отношениях, т. е. любое животное с равными основаниями мо- 
жет быть взято в ту или другую экспериментальную группу 
(вариант опыта). Каким образом из 14 животных выбрать 7, ко- 
торые будут получать диету с высоким содержанием белка, и 7, 
которые будут получать диету с пизким содержанием белка? 
Или, другими словами: взяв первую попавшуюся из 14 крыс, в 
каком варианте опыта ее использовать? 

Эта задача может быть решена следующим образом: жнвот- 
ные распределяются по вариантам опыта случайно. Такая 
процедура носит название рандомизации (от англ. random — 
случайно). Современные представления о биологической измен- 
чивости позволяют утверждать, что 14 крыс просто не могут 
быть идентичны по всем признакам и свойствам. Рандомиза- 
ция, естественно, не приведет к тому, что животные, отнесен- 
ные к разным вариантам опыта, станут идентичными по всем 
показателям. Рандомизация являет собой в некотором смысле 
«механическую» процедуру, снимающую субъективизм опреде- 
ленного экспериментатора, опрсдсленные неконтролируемые. 
предпочтения. При проведении рапдомизации во всех экспери- 
мептах мы обеспечиваем выравнивание в среднем, избавляем- 
ся от систематических тендсиций в формировании групп. 
Читателю, по-видимому, уже ACHO, что вопрос о рандомиза- 
цин, возникший при рассмотрении двух выборок, идентичен во- 
просу об обеспечении простого случайного выбора из генераль- 
пой совокупности. Это одна из основ математической стати- 
СТИКИ. 

Как практически осуществляется рандомизация? Все 14 жи- 
вотных, отобранных для опыта, нумеруются в произвольном по- 
рядке: 1, 2, ..., 14. Затем обращаются к таблицам равномерно 
распределенных случайных чисел (табл. І Приложения). Табли- 
цы случайных чисел содержат несколько сотен-тысяч цифр 0, 1, 
... 9, каждая из которых представлена в одинаковом количе- 
стве, и все цифры хорошо перемешаны, т. е. рядом с любой про- 
извольно выбранной цифрой равповероятно оказывается любая 
из 0, 1, ..., 9. Начиная с любого места таблицы и двигаясь в 
произвольном паправлении (по строке, столбцу, диагонали 
пт. д.), выбирают первые 7 двузначных чисел. Например, это 07, 
08, 01, 05, 11, 02, 14. Тогда для вариапта опыта с высоким CO- 
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держанием белка в диете возьмем животных № 1, 2, 5, 7, 8, Ц 
14, а оставшихся животных (№ З, 4, 6, 9, 10, 12, 13) возьмем длу 
варианта с низким содержанием белка в диете. Гаким образоу 
распределение животных по вариантам опыта осуществлено слу. 
чайно, вне зависимости от желаний и склонностей эксперимен 
татора. 

В связи с рассмотрением рандомизации опишем два при, 
мера, отвлекшись на время от анализа примера ГУ-8. В одион 
из них отсутствие рандомизации чуть было не повлекло за со. 
бой признания открытием явного артефакта. Другой пример 
представляет собой редкий случай эффективной рандомизаци 
в медицинских исследованиях, остроумно проведенной в виде 
«квазиэксперимепта». 

Пример ІУ-9 (В. И. Қорогодин). Изучалось влияние гамма. 
облучения дрожжей на интенсивность сбраживания сахара 
Опыты ставили следующим образом. Навеску прессованных 
дрожжей делили на шесть равных частей, три облучали, а три 
оставляли в качестве контроля. Затем каждую пробу помещали 
в сахариметр — прибор для определения концентрации сахара, 
Всего использовали шесть сахариметров, совершенно новых, 
только что полученных. Сахариметры разместили на стенде, 
причем № 1, Зи 5 использовали для работы с облученными об. 
разцами, а № 2, 4 и 6— для работы с необлученными. Первый 
эксперимент показал, что облученные клетки в десять раз интен. 
сивнее сбраживают сахар, чем необлученные! Пораженный столь 
необычным результатом, исследователь повторил опыт — то же 
самое. Третья повторность дала такие же результаты... Тогда, 
не поверив самому себе, исследователь применил другую ме. 
тодику регистрации брожения, — и эффект исчез... Тщательное 
обследование сахариметров показало, что три из них, всегда быв: 
шие «контрольными», имели еле заметные трещинки в стекле, 
через которые улетучивался СО» — продукт брожения, а три 
«опытные» были совершенно исправными. 

Превосходная воспроизводимость результатов всех последо- 
вательных опытов была воспроизводимостью артефакта 
Если бы перед каждым опытом проводилась рандомизация, 
ошибка обнаружилась бы скорее: уже после второй повторности 
была бы установлена чрезвычайно большая изменчивость как 
в опытных, так и в контрольных группах, что свидетельствовалс 
бы о каких-то дефектах методики. Ошибки удалось бы избежать, 
если бы все шесть сахариметров были тщательно выверены пе: 
ред началом опытов. Только скрупулезность и трезвость исследо: 
вателя избавили радиобиологию от лжеоткрытия. 

Пример ІУ-10 (Э. Ф. Қазанец). На материалах травматоло- 
гического института изучался вопрос об отдаленных последст: 
виях черепно-мозговых травм. В архиве института были отобра: 
ны истории болезни лиц, попавших в автомобильную катастрофу 
10—15 лет назад. Контрольная группа была представлена людь 
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ми, получившими какую-то травму, например перелом конеч- 
ности; при этом записи в истории болезни полпостью отрицали 
возможность черепно-мозговой травмы. «Опытная» группа, на- 
против, включала людей, перепесших черепно-мозговые травмы 
определенной категории. Все избранные для изучения лица по 
почте были вызваны в институт. Большииство из них откликну- 
лось, И ОНИ были подвергнуты квалифицированному психоневро- 
логическому обследованию. 

` Оказалось, что в группе, перенесшей 10—15 лет назад че- 
епно-мозговую травму, намного чаще, чем в контрольной, встре- 
чаются шизофрения, эпилепсия и другая тяжелая патология. Это 
явно противоречило всей совокупности имеющихся данных об 
отдаленных последствиях черепно-мозговой травмы! Тогда aB- 
тор, будучи очень аккуратным исследователем, повторил экспе- 
римеит: провел новую выборку, новые обследования. Итог: на 
сей раз та же тяжелая патология встречалась достоверно вы- 
ше... в Контрольной группе! Явный абсурд, показывающий на- 
личие серьезных дефектов в организации эксперимента. Автор 
подверг детальному изучению все материалы и обнаружил, к 
своему удивлению, что лица, принадлежащие к контрольной н 
опытной группам, различаются отнюдь не только по характеру 
травмы, по и по ряду признаков, не имеющих на первый взгляд 
прямой связи с исследуемым вопросом: по соотношению полов, 
распределениям по возрасту, профессии и т. д., и т. п. Таким 
образом, наблюдаемые эффекты суть следствия каких-то не- 
контролируемых в эксперименте причин и условий. 

И вот тут-то автору и удалось найти изящное решение зада- 
чи. Оп стал отбирать в архиве не все истории болезни подряд, 
а исходя из определенной «модельной» ситуации: автомашина 
врезалась в группу людей, кто-то чисто случайно получил че- 
реппо-мозговую травму, а кто-то — другой вид повреждений. 
Остроумная организация «квазиэксперимента» 10—15 лет спу- 
стя: внешнее и явно нецеленаправленное воздействие потеряв- 
шего управление автомобиля является случайным по сути! Ана- 
лиз этого «эксперимента», также повторенного, дал очень четкие 
результаты: в группе лиц, перенесших черепно-мозговую трав- 
му, несколько с большей частотой встречались относительно сла- 
бо выраженные психоневрологические отклонения. 

Отметим одну особенность, весьма характерную для обоих 
вышеприведенных примеров. И в том, и в другом случаях ис- 
следователи активно использовали весь багаж знаний, ранее на- 
копленных в соответствующей области. Они не спешили обрабо- 
тать — описать — опубликовать результаты, но действовали в 
высшей степени профессионально. 

Вернемся теперь к примеру ГУ-8. Предположим, что проду- 
мапы все детали техники эксперимента, 14 животных разбиты 
па две группы. Какие статистические задачи возникнут после 
того, как эксперимент будет завершен? Обратите внимание: 
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мы обсуждаем статистические задачи до начала Эксц, 
римента, поскольку это последний этап его планировани, 
Работа ведется с количественным признаком «приращение ма, 
сы между 28 и 84 днями жизни». Объемы выборок невелик, 
Пі =72=7, поэтому вопрос о том, является ли распределение қ 
неральной совокупности нормальным, вряд ли удастся решит 
используя данные этого эксперимента. 

Допустим, что общие соображения делают это предположь 
ние вполне правомочным. Допустим, что средние прибавк 
(средние арифметические) т; = 124,9 и т›= 101,0, можно и 
пользовать в качестве оценок средних значений ри и цо Ген 
ральных совокупностей (покажем это мы в следующей главе) 
Тогда, чтобы ответить па поставленный в примере ГУ-8 вопро 
нужно проверить нулевую гипотезу Но: р = иә; альтернативна; 
гипотеза Hi: ш = u2, поскольку у пас нет никаких основани 
полагать, например, что ш>цо, но не р < ро. Может возникнут 
вопрос, нельзя ли в этом примере поменять местами Но и H, 
т. е. Но: шо; H, : ш= по. Нет, нельзя! Дело в том, что нуле 
вая гипотеза должна содержать число, однозначно задаюше 
геперальную совокупность. В случае Но: ш = имеем H, 
ш--из+ 0. А вот в случае Нұ: в1=-и2 мы ничего не можем ска 


зать о значении разности р; —џо, эта гипотеза пе конструктив 
на. Обратите внимание, что биолога в рассматриваемом при 


мере интересует разность ш--цо; вопрос же о сравнении 02 . 


с> не ставится. Быть может, в данном случае это и оправдан 


но еще Р. А. Фишер как-то заметил, что биолог склонен де 
лать акцент на сравнении средних, пренебрегая часто сравнени 
ем изменчивости, т. е. дисперсий. 

Если на уровне значимости © нулевая гипотеза будет при 
нята, то говорят, что разница между средними привесами н 
значима (синонимы: статистически не достоверна, не сущее 
венна); если нулевая гипотеза будет отклонена и, следователи 
но, принята альтернативная гипотеза, говорят, что разниц 
значима. 

Если предположение о нормальности распределения ген 
ральной совокупности не правомочно, приходится пользоватьс 
другими методами, описанными в гл. УІ. 

Рассмотрим еще несколько задач, возникающих при сравн 
нии двух выборок. 

Пример IV-11 (по Л. Д. Мешалкину [1963]). Исследовани 
длины и ширины 139 черепов, найденных в Верхнем Египте 
относимых к расе, жившей за 8000 лет до нашей эры, показ: 
ло, что выборочные дисперсии этих признаков равны 32,741 
21,271 соответственно. Те же величины, выведенные на основ: 
нии обследования 1000 европейцев, оказались равными 37,9 
п 25,553. Можпо ли считать, что изменчивость изучаемых пр! 
зпаков сильнее выражена у современных европейцев? 
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В противоположность примеру ТУ-8 здесь задача исследова- 
ния сосредоточена на изучении изменчивости. Предполагая 
нормальность распределени, сформулируем для каждого из 
признаков Но: с;=6;. Результат проверки этой нулевой rano- 
зы н даст ответ на вопрос, содержащийся в примере. 

Пример ІУ-12 (по Ф. Б. Хатту, 1963 г.). Различаются ли 
ве породы медопоспой пчелы по устойчивости к американско- 
му гнильцу — болезни, вызываемой Bacillus larvae (табл. 9)? 


те 


Таблица 9 
устойчивость к американскому гнильцу двух пород медоносной пчелы 
(к примеру ІУ-12) 


Выжившне личинки 


Порода Число зараженных 


личинок число 06 


дата -------------------------<----------------- 


ВО СКО 5-24 5а ы ва 276 69 | 25,0 
Шартрезская ........ 395 185 46,8 


Здесь мы имеем дело с качественным альтернативным при- 
знаком. Предполагая, что признак имеет биномиальное распре- 
деление, можно получить оценки hı параметра pı и hg парамет- 
ра рг. Статистическая задача будет заключаться в проверке 
Но: рі == Ра. 

Пример 1У-13. На чашку Петри с плотной питательной cpe- 
дой нанесен смыв с почвенного образца. На чашке выросли 42 
колопии одного вида микроорганизмов и 7! колония другого ви- 
да. Есть ли основания полагать, что численности популяций этих 
двух видов различны? 

Предположив, что признак имеет распределение Пуассона, 
используем т; =42 как оценку № и то--7| как оценку Хо. 3a- 
дача заключается в проверке Но: A = А. 

Пример ІУ-14 (по В. А. Елизарову, 1972 г.). Дважды (с ин- 
тервалом в 10 лет) изучалось распределение больных туберку- 
лезом по возрасту. Результаты приведены в табл. 10. Изменился 
ли возрастной состав больных? 


Таблица 10 
Распределение больных туберкулезом по возрасту (к примеру 1У-14) 
Гол » Возраст, годы | = 
обследования 21 | 1—6 | 7-19 29—39 | 40-<9 | > 69 те 
1954 6 42 181 468 295 40 1233 
1954 12 01 164 233 260 62 792 


Здесь речь идет о качественном признаке, подразделением 
на шесть групп (так представлена группировка материала по 
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количественному признаку). Задача сводится к сравнению двух 
полиномиальных распределений. Нулевая гипотеза заключается 
в том, что вероятности всех возрастных классов не изменились 
за 10 лет, так что, например, частоты В и йо (первый индекс— 
принадлежность к первой или второй выборке; второй индекс— 
1-й возрастной класс) являются оценками неизвестного значения 
параметра pı; частоты ИМ и йз — оценками параметра ро и т. д, 
Альтернативная гипотеза: хотя бы один из параметров из. 
меняется, т. е. имеем разные р; и ро; хотя бы для ОДНОГО из 
классов (см. гл. ПІ, $ 3). 


$ 4. СРАВНЕНИЕ НЕСКОЛЬКИХ ВЫБОРОК 


Обсуждая следующий пример, мы покажем, чем отличается 
задача сравнения нескольких выборок от задачи сравнения двух 
выборок. 

Пример ІУ-15. На относительно одпородном участке, разби. 
том на 20 делянок одинакового размера, были высеяны 4 сор- 
та пшеницы, каждый в 5 повторностях. Полученные урожаи 
приведены в табл. 11. 

Таблица ll 


Урожаи четырех сортов пшеницы (кг на делянку) (к примеру ІУ-15) 


Делячка 


, Средний 
Сорт я | 3 | 4 | 5 урожай 
А 32,3 34,0 34,3 35,0 36,5 34,42 
В 33,3 33,0 56,3 36,8 34,5 34,78 
C 30,8 34,3 35,3 32,3 35,8 33,70 
D 29,3 26,0 29,8 28,0 28,8 28,38 


Различаются ли урожаи разных сортов? Прежде всего oôpa- 
тим внимание на организацию опыта. Проводится одновремен- 
ная оценка (в одном эксперименте) четырех сортов. Если 20 
делянок с точки зрепия экспериментатора равпоценны, это 
озпачает, что сорта должны размещаться по делянкам случай- 
но, т. е. должна иметь место схема полной рандомизации. Эк: 
спериментатор нумерует подряд все делянки; первые пять дву: 
значных цифр <<20, извлеченные из таблицы случайных чисел 
(см. табл. I Приложения), озпачают номера делянок, на KO- 
торые будет высеваться сорт А; вторые пять — сорт В и т. д. 
(рис. 34, а). Обратите внимание, что номера делянок 1, 2, ... 
в табл. 11 — это просто порядковые номера, так что сравнение 
в табл. 11 по столбцам никакого смысла не имеет. Читателю 
ясно, что задача сравнения четырех сортов теряет всякий смысл, 
если, скажем, урожай сортов А и В учитывался при посеве в 
CHH год, а сортов Си D — в другой. 

Средние урожаи в опыте являются оценками средних урожа- 
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ев генеральных совокупностей (сортов в целом) ш, p2 .... He- 
обходимо ответить на вопрос: являются ли различия между, с 
борочиыми средними случайными ИЛИ действителна по пано 
ope некоторые, генеральные средние разные: оте а 
зами, пулевая гипотеза Но: p= p= ps = pa =y против 111: CP 
нее XOTA бы для одного 
сорта отличается от осталь- 
ных, например рр; (196 
оо ли свести эту за- 
ачу К нескольким задачам 
попарного сравнения сортов, 
например сравнивать А и В, 
АнС,... Си D? Тогда бы 
мы оказались в условиях 
примера ГУ-8. Нет, нельзя. 
Такой подход не соответст- 
вует структуре эксперимен- 
та. Ведь экспериментатор 
работает одновременно с Рис. 34. Размешение 4 сортов, каж- 
четырьмя выборками. Тем дый в пяти повторностях, по 20 де- 
самым мы имеем совместное НВ: 
четырехмерное распределе- а — о" 6 — слу- 
ние, которое, как мы устано- 
вили в гл. 1, не сводится к своим маргинальным двумерным 
распределениям, возникающим при попарном сравнении ре- 
зультатов опыта. 

В экспериментах типа рассматриваемого схема полпой ран- 
домизации имеет определенные недостатки. Посмотрите на 
рис. 34, а: участок из 20 делянок вытянут в длину, а на таком 
участке вполие возможны систематические изменения почвенных 
условий (влажности, химического состава почвы и т. д.). В этих 
\словиях предпочтительно наложение частичного ограничения 
па рандомизацию. Разобьем участок на 5 последовательных бло- 
ков, каждый из которых включает 4 делянки, и будем прово- 
дить рандомизацию сортов в пределах каждого блока (рис. 
34,0). При таком планировании опыта последующий статисти- 
ческий анализ позволяет учесть изменчивость между блоками, 
пе имеющую никакого отношения к изменчивости между сор- 
тамн. Если опыт проводился по методу случайных блоков, то 
столбцы в табл. 11 являются блоками, и именно в пределах каж- 
дого столбца ведется сравнение сортов. Решение задач этого 
тппа дается в гл. ҮШІ. 

Пример ІУ-16 (по В. П. Эфроимсону, 1964 г.). Изучались 
частоты групп крови системы АВО у разных народов (табл. 12). 
Различаются ли эти распределения достоверно? 

Задача, содержащаяся в данном примере, заключается в 


а, 
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Таблица 1) 


Частоты групп крови системы АВО (в скобках — проценты от общего числа 
обследованных в данной выборке) (к примеру ІУ-16) 


Число людей, имеющих группу крови 


В 
Выборка б | р | В | АВ елен 

РЕ 22 1 5 3 Е 
Китайцы (Кантон) (426) ае: (280) бв 500 
P 712 577 S77 191 p 
Индийцы (30,2) (24,5) (37,2) (8,1) 2357 
А 1283 952 516 154 те 
Арабы (440) | (330) | (177) | (5,3) о 
> 279 0 2-57 0 Ее 
Бушмены (83,0) (0,0) (17,0) (0,0) 336 
Коренные жители 327 243 23 10 603 
Австралии (542; (40,3) (3,8) (1,7) Ы 


сравнении пяти выборочных полиномиальных распределений, 

Обратите внимание, что объемы выборок разные. Нулевая 
гипотеза формулируется следующим образом — Но: пять выбо- 
рок извлечены из одной генеральной совокупности, имеющей 
полиномиальное распределение с параметрами Pi, ро, рз, ра. 
Альтернативная гипотеза — H: хотя бы одна выборка извлечена 
из другой генеральной совокупности, т. е. хотя бы один пара- 
метр ртеріһ. Решение этой задачи будет дано в гл. УП. 

Перейдем теперь к рассмотрению биологических задач, при- 
водящих к анализу статистических связей. 


$ 5. АНАЛИЗ СТАТИСТИЧЕСКИХ СБЯЗЕЙ 


Этот тип задач отличается от задач, описанных в предыду- 
щих параграфах, тем, что у каждого исследуемого объекта 
(клетки, особи, популяции, сообщества) регистрируется сразу 
несколько признаков и оценивается наличие связи между при- 
знакамн. В нашем учебном пособии мы рассмотрим случай 
лишь двух признаков. Методы решения задач, содержащихся в 
примерах IV-17 и ІУ-18, даются в гл. ІХ, а в примере ТУ-19-- 
в гл. УП. 

Пример 1У-17 |зоКа!, Rohlf, 1969]. С целью изучения Mop- 
фологии краба Pachygrapsus crassipes у каждой из 12 отлов- 
ленных особей определялись масса жабр и масса тела (табл. 
13). Скоррелированы ли исследуемые признаки (рис. 35)? 

Каждая особь, таким образом, характеризуется парой чисел 
(Хъ Хоа). Поэтому в качестве статистической модели мы можем 


рассматривать двумерные случайные величины (Xii, Хо). Мерой 
связи между признаками служит коэффициент корреляции р, 
причем для некоторых важных в биологии случаев (в частности, 
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Таблица 13 


Масса жабр и масса тела у краба Pachygrapsus crassipes 
(к примеру 1У-17) 


— Масса Масса 
2 e—a Но; ---------------------- 
номер 0сооп жабр, мг | тела, T ыы жабр, мг | тела, г 

| 

| 159 14,40 | 7 100 1,41 

о 179 1 5,20 | 8 320 15,81 
0 430 | 

A 45 | 250 | i 20 12:39 

5 384 2270 | n 320 17,29 

6 230 14:90 | 12 210 9,52 


для двумерного нормального распределения) р=0 
означает, что случайные величины независимы. Таким образом, 
прежде всего нужно решить вопрос о правомочности предполо- 
жения о двумерном нормальном 
распределении (этого предполо- 
xera потребует и последующее 
нспользова пие статистических M€- 20 
тодов). Если, например, данное 
предположение правомочно, то | O 
необходимо оценить выбсрочный 16- оф © 
коэффициент корреляции г и про- о 
верить гипотезу, что коэффициент , 
корреляции генеральной совокуп- | 
ности о--0. Если предположение | 
о двумерном нормальном распре- 8) 
| 
| 
| 
| 


24-5 х,,г 
е! 


делении генеральной совокупно- 

сти неправомочно, то оценивают 
ранговый коэффициент корреля- “! 
ЦИН. | 
В предыдущих параграфах, | | | О 
когда у каждого объекта учиты- 0 20 200 290 400 
вался один признак, мы всякий 

раз приходили к двум типам ста- Рис. 35. Связь между массой 
тистических задач: оценке mapa- Жабр (xı) и массой тела (хз) 

Ж у краба (пример ІУ-17). 
метров распределений и сравне- 
нию параметров (или распределений). На примере ІҮ-17 мож- 
но видеть, что К тем же типам задач мы приходим и при анали- 
зе систем двух признаков. 

Пример ГУ-18 (по М. Демерецу, 1943 г.). Изучалась зави- 
симость между дозой рентгеновского облучения и частотой ви- 
димых мутаций у нейроспоры (табл. 14). Проанализируйте за- 
висимость «доза — эффект». 

Здесь речь идет об установлении вида функциональной зави- 
симости и=/(х). Одип признак (доза облучения) произволен 
и обычно предполагается — точно задается экспериментатором, 


105 


Таблица 14 


Зависимость между дозой рентгеновского 
облучения и частотой мутаций у нейроспоры 
(к примеру ІУ-18) 


Доза облучения, кР 


Частота мутаций, % 


это независимая переменная, ее зпачения х;. Другой признак — 


значения у; случайных величин Yi; наблюдаемые при фиксиро- 
ванных х;. Отличие от корреляционной задачи, где оба признака 
варьировали вне воли зкспериментатора, очевидно. 


| 4 


v 


A 4 
пропен мутацяй 


(931 пдлучения, «В 


Рис. 36. Зависимость процента му- 

таций у нейроспоры от дозы рент- 

теновского облучения (пример 
ГУ-18). 


Приступая к регрессионным 
задачам, всегда следует начи- 
пать с построения графика. На 
рис. 36 видно, что предположе- 
пие о линейной зависимости про- 
цента мутаций у нейроспоры от 
дозы облучения совершенно есте- 
ственно (если бы зависимость 
отличалась от линейной, меняя 
масштаб по осям координат, мы 
бы попытались линеаризировать, 
«спрямить» ее, потому что это 
простейший вид функции и его 
проще всего анализировать). За- 
дача заключается теперь в том, 
чтобы по данным выборки най- 
ти уравнение у=а-фх, где а и 
b — выборочные оценки mapa- 
метров x и р генеральной COBO- 
купности. Хотя из рис. 36 влия- 
ние облучения представляется 


«па глаз» очевидным, все-таки необходимо строго проверить 


гипотезу р--0. 


Пример ІУ-19 (по Л. Д. Мешалкину [1963]). У 413 человек 
определялась односторонность в развитии рук по испытанию в 
поднимании тяжестей и глазпая односторонность по общему 
астигматизму (табл. 15). Есть ли связь между этими призна- 


ками? 


По сути своей это корреляционная задача. Однако коэффи- 
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Таблица 15 


Взаимосвязь между односторонностью в развитии рук и глаз 
(к примеру ІУ-19) 


-- Глазная односторонность 


Односторонность в развитни рук 


левоглазые | обоеглазые | правоглазые 

Е Е ЕЕ 
орукие (левши) ........ 34 62 28 
ео 21 28 20 
Праворукие ............ 57 105 52 


циепт корреляции введен лишь для непрерывных случайных ве- 
личин, а в дапном примере оба признака имеют полипомиаль- 
ное распределение. 


ж 


Выше (5 2-5) мы рассмотрели основные типы статистиче- 
ских задач, возникаюших в количественной биологии. Совету- 
ем читателю, прежде чем двигаться дальше в изучении предме- 
та, еше раз просмотреть этот материал, чтобы научиться рас- 
познавать, «в чем суть задачи». Вопрос «как решать задачу» 
будет рассматриваться в следующих главах. 

На протяжении предыдущих глав неоднократно подчеркива- 
лось, что статистический анализ в биологии начинается с выбора 
адекватной математико-статистической модели, по существу это 
уже первый этап статистического анализа. 

Следующий этап анализа — применепие статистического ап- 
парата для решения поставленной задачи к данным выборки. 
Как правило, соответствующий метод удается найти в учебии- 
ках и справочпиках по статистике; передко и модель строится 
уже под известный метод. Однако пельзя исключить, что в не- 
которых случаях определенная постановка биологической зада- 
чи потребует какой-то повой статистической разработки; обыч- 
по эту разработку может осуществить или специалист в области 
математической статистики, или статистически грамотный био- 
лог в содружестве с математиком. 

Наконец, последпий этап анализа — биологическая интер- 
претация получепных статистических результатов. Для успеш- 
пого осуществлепия этого этапа от биолога требуются и про- 
фессиональная биологическая подготовка, и знание основ ма- 
тематической статистики. 


Задачи 
ГУ-1 |Кендалл, Стьюарт, 1966]. Постройте график распределения по 
возрасту для смертности от менингита (табл. 16). Почему материал сгруп- 
пирован в классы с перавными интервалами? 
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Таблица 16 


Смертность от менингита в Англии и Уэльсе в 1953 г., 
n =414* (к задаче ТУ-1) 


p СЕ 


Возраст (<%), Число смертей Возраст (2), Число смертей 
годы і годы (2) 
| 
(= „= 162 35— 5 
1- 99 40— 11 
2— 11 | 45— 17 
3— 6 | 50— 21 
4— 0 в 55— 32 
5— 10 | 60— 23 
10— 8 | 65— 29 
15-- 6 | 70— 15 
20— 4 | 75— 11 
25— 3 | 80— 10 
30— 5 і 95 и выше 5 


* 0 — обозначает возраст до 1 года, 1 — возраст от 1 ro- 
да до 2 лет ит. д. 


1У-2 (дапные С. Хсиа и др. по А. Пьяцца, 1981 г.). С целью оценить 
влияние родственных связей на интенсивность иммунного ответа было изу- 
“спо распределение титров антител к вирусу цитомегалии в семьях менно- 
нитов, проживающих в Индиане (табл. 17). Постройте и опишите график 
этого распределения. Попробуйте получить распределение, близкое к HOP- 


мальному, пспользуя преобразования 1/х,У хи Іор х (в последяем случае 
обоснуйте выбор основания логарифма). 


Таблица 17 


Распределение титров антител к вирусу цитомегалии у меннонитов Индианы, 
п = 380 человек (к задаче ІУ-2) 


Обратный титр Е Число л:одей (^i) | Обратный титр (<;) | Число людей (п;) 
2 23 ; 16 | 110 
4 3 | 32 60 
8 90 | 61 34 
| 128 10 


1У-3 (данные Г. Э. Пирс, по М. Кендаллу и А. Стьюарту [1966]). По- 


строите и опишите график распределения степени облачности в Гринвиче 
для июля (табл. 18). 


ГУ-4 (данные Дж. В. Т. Метьюза, по К. Мардиа [1978]). Найдите на- 
глядное графическое изображение для данных по ориентации немигрирую- 
щих английских крякв Anas platyrhynchos (табл. 19). 


ГУ-5. «При своем посещении Фарнейских островов у берегов Нортум- 
берлэнда Бэтсон обратил внимание на их богатство уховертками...» [Филип- 
ченко, 1978, с. 103—104]. Воспроизведите график полученного Бэтсоном рас- 
пределения длины клещей у самцов уховертки Forficula auricularia 
(табл. 20). Чем можно объяснить наблюдаемую картину? 


1У-6. А. К. Эйткен (по Г. Крамеру [1975]) приводит распределение для 
показаний часов, выставленных в витринах часовщиков (табл. 21). Построй- 
зе график этого распредсления. О чем он говорит? 
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Таблица 18 


Интенсивность облачности в Гринвиче для июля 1890— 
1904 rr., n =1715 (к задаче ІУ-3) 


Степень Число | Степень Число 

облачности наблюдений облачности наблюдения 
(^;), усл. сд. (ri) (х;) , уел. ед. (np 

0 320 | 6 55 

1 199 | 7 65 

2 74 | $ 92 

3 68 | 9 148 

4 45 | 10 676 

5 45 


Таблица 19 


Распределение значений угла исчезновения английских крякв, 
П--714 птиц* (к задаче 1У-4) 


Направленне Число птиц Паправление Число птиц 
зи (7,) (хр ("р 
0°— 40 | 1802-- 3 

20— 22 22 900- 11 
40-- 20 | 220— 20 
60— 9 2 24 
80— 6 | 2605 58 
100— 3 | 280— 136 
120— 3 | 300 — 135 
140-- 1 320-- 143 
160— 6 340— 69 


* Угол исчезновения — это азимут той точки на горизон- 
те, в которой выпущенная наблюдателем птица скрывается 
из виду. 0 — обозначает направление от 0° (север) до 20°, 
20 — от 20 до 40° ит. д. 


Таблица 20 


Длина клещей у самцов уховертки на Фарнейских островах, 
п--584 особи (к задаче ІУ-5) 


Длина клещей 


Число особей Длина клещей Число особей 


(ЭПИ (7) ми (21) 5 
3,0 4 р 65 42 
3,5 195 | 7,0 90 
4,0 52 | 7,5 68 
4,5 7 | 8,0 44 
5,0 12 8,5 8 
5,5 24 | 9,0 6 
6,0 42 | 
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Таблица 21 


Показания часов в витринах часовщиков, / = 1000 часов“ 
(к задаче ІУ-6) 


Показания Число Показания Число 
часов наблюдений часов наблюдений 
(2) (®;) (54) (^1) 
0— 77 6— 73 
1 — 81 7-- 70 
2— 95 8— 77 
3— 86 9— 82 
4— 98 10— 84 
5— 90 11 — 87 


* 0 — обозначает промежуток времени от 0 до | ч, 1— 
от | до 2 чит. д. 


ГУ-7. А. Хальд [1956] приводит два эмпирических распределения: 1) для 
суммы 4 случайных чисел (табл. 22) и 2) для суммы 16 случайных чисел 
(табл. 23). Постройте и опишите графики этих распределений. 


Таблица 22 


Распределение суммы 4 случайных чисел, 71-- 200 
(к задаче ІУ-7) 


Число случаев Число случаев 


| 
Сумма (4) (т) | Сумма (х1) | (п;) 
| 
0— 4 0 | 19—20 25 
5— 6 2 21—22 22 
7— 8 9 23—24 28 
9—10 7 | 25—96 10 
11—12 21 27—28 8 
13—14 16 29—30 4 
15—15 20 31-36 0 
17--18 34 


Таблица 23 


Распределение суммы 16 случайных чисел, 7t =200 
(к задаче 1У-7) 


+ l 
Сумма ФА Число случаев | Сумма (х;) сло случаев 


(4%) (7;) 
0—44 0 | 75—79 33 
45—49 3 |  80— 84 25 
50—54 14 ко 85- 89 12 
55--59 14 | 97— 94 10 
60--64 19 ' 95- 99 2 
65--69 28 į 100—104 1 


70—14 39 | 105—144 0 
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1\/-8 Перептьев, Ростова, 1977]. Проведнте графический анализ призна- 
ка «размеры крипт» (в делениях окуляр-микрометра) в ободочной кишке 
крыс: 

{0 8 12 16 9 10 7 9 9 14 10 10 
8 9 11 9 8 10 11 9 10 11 10 10 10 
8 11 12 9 9 10 10 10 10 10 7 8 9 


Т 8 9 8 10 Ш 9 0 9 8 9 9 7 
о ою вз 9 9 12 0 9 в 7 10 01 
9 з 8 8 8 13 12 0 9 в 7 012 
а 10 10 8 8 7 9 0 1 оо 8 8 7 
910 м 40 7 13 W 9 42 12 40 8 


g 8 T 10 

IV-9. Сопоставьте примеры ІУ-8 и IV-15. Если вы располагаете методом 
анализа второго из них, что можно сказать о применимости этого метода 
к первому? 

1У-10. Сопоставьте примеры ГУ-12, ІУ-14, ГУ-16 и ТУ-19. Сформулируй- 
те для них Но одного типа. Если вы располагаете методом анализа примера 
ІУ-19, что можно сказать о его приложимости к остальным примерам? 

[\У-11. Можно ли использовать табл. З в качестве таблицы случайных 
чисел? 

ІУ-12 (P. А. Нежиховский, 1981 г.). В табл. 24 приведены статистиче- 
ские данные о наводнениях в устье р. Невы за 278 лет существования 


г. Ленинграда (с 1703 по 1980 г.). Постройте графики распределений и срав- 
ните их. Какому распределению подчиняются эти данные? 


Таблица 24 


Распределение числа наводнений в устье р. Невы по 
годам за 278 лет (1703—1980 гг.) (к задаче ІУ-12) 


Число лет при подъеме воды 


Число наводнений над ординаром 
в году 
свыше 150 см | свыше 180 см 
0 139 206 
1 79 53 
2 37 14 
3 13 4 
4 5 0 
5 3 1 
6 0 
7 1 
8 | 


Всего наводнений... 242 95 


ГЛАВА У 


ОЦЕНКА ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 


Выше (гл. IV, $ 2) говорилось, что для оценки параметра 
распределений используются статистики, к которым предъяв 
ляются требования состоятельности, несмешенности и эффектив. 
ности. Учитывая эти требования, а также то обстоятельство, чт 
для оценки одного и того же параметра могут быть использо. 
вапы разные статистики, естественно задать вопрос: с помощь 
каких методов следует выбирать их? Наиболее распростране; 
метод максимального правдоподобия, предложенный Р. А. Фи, 
шером. 


$ 1. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ 


--- 


Пусть х, Хо ..., Ха-- независимые случайные величины 
каждая из которых имеет плотность распределения f(x). Для 
целочисленных случайных величин мы рассматривали бы рас 
пределение вероятностей р{х}. Предполагается, что вид рас 
пределения f(x) (или р{х}) известен; неизвестно только значе 
пие некоторого параметра Ө, который надлежит оценить по ре 
ализациям д], Хо, ..., Ха этих случайных величин. Например, 
если р(х)-- распределение Пуассона, то Ө — параметр А. Пусть 
Ф(х) — плотность совместного распределения случайны! 


величин х], ..., Ха. В дальнейшем будем иметь дело только ‹ 
независимыми случайными величинами, поскольку это, как пра: 
вило, соответствует структуре большинства биологических эк: 
спериментов. Для конкретных реализаций хі, Хо,..., Хи функция 
Г.(Ә)--ж(Хі, Хо, ..., Xn, Ө) называется функцией правдоподобия. 

Сущность метода максимального правдоподобия состоит в 
том, чтобы найти «наиболее правдоподобное» зпачение пара: 
метра ©, т. е. такое, при котором значение функции правдопо: 
добия максимально. При максимизации Г (Ө) подразумевается 


что значения х], Хо ..., Ха случайных величин ху, Хо,..., Ха фик 
сированы, а переменпой величиной является параметр Э. Друг! 
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ми словами, максимум 1(6) отыскивается в предположении, 


что Yo X2% ..» Ха заменены их выборочными значениями. Так 
как удобнее иметь дело не с величиной Г (Ө), а с ее логариф- 
мом, то требуемое значение Ө находят, решая относительно 
д уравнение правдоподобия 


(п Г. 
—— = 0. 
49 
Если распределение имеет несколько, например k, параметров 
е, Өх, --» Or, необходимо приравнять нулю частные произ- 
водные Іп L по этим параметрам и решить систему 
да Г, 2- 
дөр" 
д іп / 
ие =, 
дӘ, 


Рассмотрим задачу оценивания параметров u и о? нормаль- 
ного распределения. В силу того, что плотность совместного рас- 
пределепия независимых случайных величин равна произведе- 
нию их плотностей (см. гл. Ш, $ 2), функция правдоподобия в 
этом случае имеет вид 


сагата ИА | n У. 2 
109, өз) = (VIT) exp |-- за, Da (х, 91) | 


и ес логарифм 


1 n я 
іп L = — Zin (2101 — m М (х, — Ө). 


96; 


Дифференцируя это уравнение по ©, п ©. и прнравнивая npo- 
изводную нулю, имеем 


Из первого уравпения получаем 

ы! к n 
(х; — 9,) = М.а х, — ЛӘ, = 
Решая это уравнение относительно Ө;, находим оценку макси- 
мального правдоподобия для среднего значения қы, которую 
обозначим т: 


з| = 


л 
Шіл В. -- % Xi: 
вы =1 


Итак, для оценки среднего значения ш нормального распределе- 
ния следует выбрать статистику 
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т.ғ 1 n — 
ІП = — Xie 
п да 


Чтобы найти оценку дисперсии с“, подставим во второе 
уравнение т вместо Ө;. Разрешая это уравнение относительно 
Өз, получаем оценку максимального правдоподобия, которую 
обозначим 


$5 = Ө, = -- (х, — т). 


Таким образом, для оценки дисперсии а? нормального распре. 
деления следует выбрать статистику 
SLNE алы 

і--і 

Статистики, полученные методом максимального правдоподо- 
бия, обладают тремя замечательными свойствами: они асимпто- 
тически (т. е. при п— оо) распределены нормально, являются 
асимптотически несмещенными и асимптотически эффектив- 
НЫМИ. 

Читатель может самостоятельно показать, что оценкой ма- 
ксимального правдоподобия для параметра р биномиального 
распределения является 

h = — 


n 


где n— общее число независимых испытаний, Е — число испы- 
таний, в которых произошло данное событие (задача У-1), и что 
оценкой максимального правдоподобия для параметра А pac- 
пределения Пуассона является 


k 
? 


где х; — наблюденное значение случайной величины; п; показы- 
вает, сколько раз оно наблюдалось; п- 2! пу есть общее число 


наблюдений и l— число различных значений х; (вариант) (за- 
дача У-2). 

Методом максимального правдоподобия мы будем пользо- 
ваться в дальнейшем для нахождения оценок коэффициента 
корреляции р и коэффициента линейной регрессии В (см. гл. ІХ, 
$ 2, 6). 


5 2. РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО СРЕДНЕГО m 


И ВЫБОРОЧНОЙ ДИСПЕРСИИ 52 
В СЛУЧАЕ НОРМАЛЬНО РАСПРЕДЕЛЕННОЙ 
ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ 


mg b 


Если хі, ... Ха распределены нормально, то статистика M 
также имеет нормальное распределение, поскольку она является 
их линейной комбинацией (см. гл. 11, $ 3). При этом 
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да 1 9: o 1 п м 1 
Ет = Е(% | еч Ex; = = пр = р. 
Найдем дисперсию т: 
- 1 “7” ~ l “АГ ех 1 Е 
Dm = (+ х) дар l Эх; = — 1057 == 
ані 1 жатыс 
JTO очень важный результат, показывающий еще одно ценное 
свойство нормального распределения; дисперсия выборочного 
С едиего B M раз меньше дисперсии отдельных случайных ве- 


HYHH, Т. е. средние группируются вокруг центра распределения 
теснее, чем отдельпые значения. Итак, справедлива следующая 


Теорема М-1. Если п независимых случайных величин 


т,... Ха распределены нормально с параметрами u и о? Kax- 
лая, то случайная величина 


распределена также нормально с параметрами p и оп. 
В качестве статистики для оценки дисперсии в предъдущем 
параграфе бъла получена случайная величина 


~o 1 ` n ре mw 
$0 = p (х-т)”. 
У. 


Это тот самый случай, когда оценка максимального правдоподо- 
бия, асимптотически несмещенная, оказывается смещенной при 
конечном n (см. задачу У-4). Несмещенной статистикой явля- 


ется 
792 1 n ры а у 
Е У" (и — ту. 


Величину (п--!) называют числом степеней свободы, смысл 
ее заключается в следующем. Хотя все N случайных величин HE- 


зависимы, квадраты (х;—т)? независимыми не являются, так 
как разпости (х;—т) связаны уравнением 


Хил (х; — т) == 0. 


Говорят, что на п независимых случайных величин наложена 
одна линейная связь, или одно линейное ограничение. По- 


этому среди всех п величин (х;—т) независимыми («свобод- 
ными») являются любые (п—1). Отсюда становится ясным про- 
исхождение термина «число степеней свободы». 


Найдем теперь вид распределения 52. Перейдем от незави- 
симых случайных величин Xi, X2, ..., Xn К случайным величинам 
у, /ә,... Yn ПО формулам 
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y= pr —х 2); 
Yə = тет. = (X1 F X2 — 23); 


“< | 
а 


ай А+. ИНИСИ Ха; 
есет (+ хи) = Үп.т. 


Так как матрица, составленная из коэффициентов этого преоб. 
разования: 


1 1 

ед Зее 0 т” 0 | 
1 1 2 0 

У2-3 39-3 тұз 7 

С = ев оао. а e.. аа 5 

! 1 1 НЕК. ола 

Ип И(п = Оп Ии- Пал У(а- l)n 
1 100 1 к 
мото Va Z 


удовлетворяет соотношению ССт= І, где 1 —единичная матрица 
порядка п, а т— знак транспонирования, очевидно, что случай. 


ные величины Yi, Йо, ..., Yn получены ортогональным преобра: 
зованием случайных величин Х), Хо, ..., Ха. Из курса линейной 


алгебры известно, что ортогональные преобразования сохраня- 
ют длины векторов, т. е. 


xi ЕЕ » yi. 


Поскольку случайные величины Yi, Yo ..., Уп являются линей. 
ными комбинациями нормально распределенных случайных ве 


м. 


ЛИЧИН Xi, Хә, ..., Ха, ТО у; также распределены нормально, при: 
чем читатель может o что 


Еу, = 0; Оу, = а? (Г = 1, 2, .... n) и Cov (Yı, y) =0 (і зе) 


т.е. случайные величины у; независимы (см. гл. ІП, $ 6) 
Из представления статистики 5% получаем 


E ау с 9 - 
(п—1) s? =), (х, — m} -У xi — пт”. 


Но у, =V n-m, поэтому 
п--1 ~o 


(n == Ds 47; == ya = = Хы у; . 
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Поделим теперь обе части уравнения на 0°: 


~? ~ \ 92 
(п— 1) Щи yi : 
с° == i= б 


Случайные величины yilo (1=1, 2, ..., п—1) имеют нормировзан- 
ное пормальпое распределение каждая, они независимы, поэто- 
му сумма их квадратов имеет распределение y? с числом степс- 


ней свободы у=и—1. Итак, доказана следующая теорема. 


Теорема У-2. Если х,..., ха — независимые нормально 
распределенные случайные величины с параметрами ци 0? 
каждая, то 
ыд 
(п —– 1) $ 


с? 


— у? (у), 


где у= 2—1. Докажем, наконец, еше одну очень важную TEO- 
рему. 2. T 

Теорема У-3. Если xi, ..., Xn — независимые нормально рас- 
пределенные случайные величины с параметрами u H с KaK- 


пая, то статистики ти 52 независимы. 
Доказательство. Выше мы получили 
С 1 п-1 “Чао, — | — 
= — Па т = == 
п--1 Дара и n Ул Уп. 


мим м Гой 


Случайные величины Yy Уә, ..., Уп независимы, откуда и сле- 


дуст независимость статистик M и 52. 

В заключение параграфа укажем, что в биометрии в каче- 
стве показателя изменчивости часто вычисляют коэффициент 
вариации 


0 = $/т. 


Удобство коэффициента вариации состоит в том, что эта вели- 
чина безразмерная. Таким образом, с его помощью возможно 
сравнение изменчивости признаков, значения которых измерены 
в разных единицах. 


§ 3. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ СРЕДНЕГО ЗНАЧЕНИЯ и 
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 


В $ 1 была указана точечная оценка џ. Задачей этого nma- 
рсграфа является пахождение интервала (Ai, Q2), в пределах 
которого с доверительной вероятностью (1--а) лежит значение 
параметра и: 

Ба <и<а»)- |--с. 


Полностью определен закон распределения случайной вели- 
чины: 
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H-E NOl 

a ы, 

Трудность, однако, заключается в TOM, что в биологически, 
задачах практически никогда неизвестно значение параметра g? 


его можно лишь оценить по выборке с помощью статистики $ 
Другими словами, требуется найти закон распределения случай. 
ной величины 


s/y n 
Результат был указан в 1908 г. английским исследователем 
В. Госсетом, опубликовавшим свою работу за подписью Стью. 
дент (student — студент), но строго был получен в 1925 r. P. А 


Фишером. Покажем, что эта случайная величина имеет 1-рас. 
пределение Стьюдента, которое было определено ранее (см. гл, 


ПІ, $8). 
Так как 
т-һ ги 
=> = и — М (0: 1), 

I (0; 1) 

а в предыдущем параграфе было показано, что 
n— 1) $ даи 
ШО) 


где у = п — l, причем эти две случайные величины незави. 


(т-р) ИлоУп-—1 т р ~ 
у- үле т Зуп = Ё(У), у= И — 1. 
хр 
Перейдем к рассмотрению выражения 
pft E E Д = |0, 
siy n 


Какие дополнительные соображения необходимы для выбора tı 


и fo? Случайная величина х генеральной совокупности распреде- 
лепа нормально, симметрично относительно u. Также симметрич: 
но (относительно нуля) [-распределение. Исследуемая выборка 
случайна, т.е. равновозможны значения т<ы и т>и. Поэтому 
представляется естествепным строить симметричный отпоси- 
тельно и доверительный интервал. 

Введем следующее обозначение, которым в дальнейшем бу- 
дем часто пользоваться: Ха есть значение случайной величины 


х, такое, что Р{х>> ха} = а. В нашем случае верхней границей 
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искомого доверительного интервала будет і. , т. е. такое значе- 


пие случайной величины Ё при х=и—1, что РИ! > taz }= 0/2. To- 
гда симметрично расположенной нижней границей будет {1-«.2, 


т. е. такое значение случайной величины 1 при у--п--І, что 
РЕ Ва | + 1--о/2 (рис. 37). Так как #-распределение симмет- 


ща 
се/2 се/2 
Ta t 
TERT 0 22 


Рис. 37. К построению доверительного интервала для среднего значе- 
ния и нормального распределения. 


рично относителъно нуля, то очевидно, что П-ао = — ао. По- 
этому приведенное выше неравенство мы запишем в виде 

т amas 

~w Е. < la? % 

зул 


Другими словами, найти границы доверительного интервала 
для и означает найти пределы интегрирования плотности 1-рас- 
пределения: 


t 
“9 

а Ғ(хуах--1--а. 
0/2 

Это можно сделать с помошью табл. ПІ Приложения. 
Разрешая полученное неравенство относительно и, имеем 


й-Һо5/)Үп<һь<т--Һз-5/ Үл. 


Для конкретной выборки объема N значения статистик т и 5 
будут равны т и $, тогда доверительный интервал для u с до- 
верительной вероятностью (1--а) вычисляется по формуле 


т Ёр: si Vn<yu< т- во“ 51 Ул. 
Поскольку при больших п (практически п>30) #-распределение 
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хорошо аппроксимируется нормированным нормальным, то до. 
верительный интервал приобретает вид 


-. ; дка ! д? 
m — laz S; Уп< их т-и, ә в), үп, 
где Uap — такое значение случайной величины ис, № (0; 1), что 


РВиз>и.о | << о/2, и оно в отличие от 1,9 не зависит от объема 
выборки (см. последнюю строку табл. ПІ Приложения). Вели. 
чину 
5 
СЕНИ Тат 

называют ошибкой среднего и, представляя результаты обработ- 
ки экспериментальных данных, часто пишут т + Sm. Так, запись 
101,8+0,16 означает, что среднее т= 101,8, а ошибка среднего 
$т==0,16. 

Пример М-1. У растений нового сорта тетраплоидной ржи 
измерена длина междоузлий (см): 7,2; 7,1; 7,0; 6,8; 6,6; 6,6; 7,2: 
7,1; 7,4; 7,0; 7,2; 7,3; 7,1; 7,1; 7,2; 7,3; 7,1; 7,6; 6,8. Требуется 
оцепить среднее значение и изменчивость признака. 

Объем выборки п= 19. Выборочное среднее есть 

| 1 Б 
m = пт Ху = то (257. +... +6,8) = 7,068 = 7.07. 


n 


Необходимо сделать замечание о точности вычислений: сред- 
нее вычисляется с точностью, на порядок большей, чем точность 
измерений; среднее квадратичное отклонение — с точностью, на 
порядок большей, чем точность вычисления среднего. Напомним 
правило округления: если округляемая цифра <5, то она OT- 
брасывается; если >>5, то в предыдущий разряд добавляется 
единица. Сумма квадратов отклонений 


—{—1 i=l п 


y” (х; — т)? е >. Xi --- D х.) == 
= 7,2 7,1946... + 6,8? — 15 134.3? = 0,741. 
Выборочпая дисперсия 


o 1 n 4 а 
ет (А т = 80,741 = 0,041 


и среднее квадратичное отклонение 5= 0,203. Коэффициент Ba- 
риации о=5/т = (0,203/7,07= 0,029 очень мал, всего 2,9%. Ошиб- 


ка среднего 5т--5/Үүп--0,203/Үү19--0,047. Таким образом, имеем 
7,07 + 0,047. Построим теперь 950 -ный доверительный интервал 
для среднего значения. Так как у-п-1-- 18, то значение 
10,025==2,10 (см. табл. ПІ Приложения): 


7,07--2,10-0,047<н<7,07--2,10-0,047, 
т. е. 6,97<<7,17. 
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6 4. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ДИСПЕРСИИ с? 
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ 


Случайная величина (п--1)52/02 имеет распределение y? с 
‚ислом степеней свободы у=и—1 (см. $ 2). Поэтому решение 
данной задачи оказывается простым. Необходимо найти гра- 
ницы (1, 42) доверительного интервала для 0? из условия 


P fa, КИ ката, 


әжең 
g- 


Распределение х2 несим- f(y?) 
метрично, поэтому границы 
доверительного интервала 
выбирают симметричными 


по вероятностям — площа- 4 И 
МЫ! г удара салан 
ДЯМ, отсекаемым на хвостах Х1-о/2 Хау х 
распределения (рис. 38). 
Имеем Рис. 38. Границы доверительного 
5 интервала для 0? нормального 
(п— 1) 5 | распределения выбирают симмет- 
А ричными по вероятностям, отсе- 
каемым на хвостах 77-распре- 


деления. 


где х: до H 72; суть такие значения случайной величины х2 при 
2% 9 ae . T 2 2\1 y2 
үш-М--І, ЧТО РИ ды --1 --0//2; Ру 220) = 9/2 и 71-2 та 


=)”. . Разрешая неравенство относительно о? и подставляя BME- 


сто 52 знФЖение выборочной дисперсии 527, получаем искомый до- 
верительный интервал: 


э 


$ У 52у 


9 
чі = 
а 2 21-а,2 


= 


Значения знаменателей находят из табл. У Приложения. 


Пример У-2. Пусть выборочная дисперсия нормально распре- 
деленной совокупности 52= 0,0349 при у=29. Требуется постро- 
ить 95%-ный доверительный интервал для 62. 

По табл. У Приложения при у-- 29 находим Хо + 49,722 и 


7975 = 16,047, отсюда 


(.0349.29 ›‚ 0.0349.29 
451 77 < — T60 


Итак, с доверительной вероятностью 0,95 значение дисперсии re- 
неральной совокупности лежит в интервале 0,0221 <0°<0,0631. 

В случае больших выборок (п>30) для нахождения довери- 
тельного интервала для параметра о? нормального распределе- 


12) 


ния можно использовать следующее выражение, которое yy 
приводим без вывода: 


е) — Цао үз (е, -1)| [L <S? | - 4, И 
2 ры 
+ зи (и. —1)], 


где Шар — такое значение и ~ М (0; 1), что Бифви,? }==0/9 (см 
последнюю строку в табл. Ш Приложения). 


$ 5. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ПАРАМЕТРА р 
БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ 


Ранее отмечалось, что биномиальное распределение может 
быть представлено через Е-распределение (см. гл. ПІ, $ 10). Эт 
обстоятельство используется для нахождения доверительного 
интервала параметра р. Приведем без вывода точные формулы 
для нахождения верхпей р, и нижней р, границ доверительного 
интервала. С доверительной вероятностью (1--а) параметр р 
лежит в пределах ра<р«<рв: 

уі Fa? 
Ps =v, y- Ро 


a, 


? 


где Fap — такое значение случайной величины Е при у= 
—=2 (2+1), ү2--2(п--Е), что Р{Е> ЁҒ, .}= 9/2; 


Ма 


Ри в У, + УІ . Ер ) ә 


где Faz — значение Е при у--2(п--#+1), у= 28, такое, что 


Р{Е > Fan } = 012. 

Пример У-3. При проверке некоторого лекарственного препа- 
рата на п--17 обезьянах у Е--3 животных наблюдались побоч- 
ные эффекты. Указать 95%-ный доверительный интервал для 
доли животных, дающих побочные эффекты. 

Точечная оценка р равна й--К/п--3/17-- 0,176, или 17,6%. 
Для нахождения верхней границы 95%-ного интервала берем из 
табл. [У,б Приложения Роо5 (У, =8; үҙ--928) =2,69, тогда 


4.26,9 


Ps == 14 + 4:2,69 == 0,435. 


Для нахождения нижней границы из той же таблицы получаем 
Ро,025 (у= 30; үҙ--б6) =5,07, тогда 


3 


Pu = 316.507 — 0,038. 


122 


Таким образом, 95%-ный доверительный интервал оказывается 
очень Широким — от 3,8 до 43,5%, что связано, конечно, с малым 
объемом выборки, обусловленным, по-видимому, дороговизной 
опытов на обезьянах. 

Для нахождения доверительных интервалов параметра р в 
биологии широко используется аппроксимация биномиального 
аланы нормальным. С доверительной вероятностью 
(1-2 


4. р ГРИ А) БР р. ВЕ 1(1--й) 
5-32 42,9 үне» <р<и я Е СА р, 


где h=kjn (ср. гл. ПТ, $ 5). Подчеркнем, что эта аппроксимация 
хороша лишь при довольно жестких требовапиях: необходимо, 
чтобы Ah(1—A) >25. Если, например, й=1—й=0,5, то необхо- 
днмо й2> 100, а для й--0,1 требуется п> 277. 

Когда частоту й умножают на 100, выражая в процентах, 
то величину Уй(1--Й)/п. 100% называют ошибкой процента 
(аналогично ошибке среднего). Распространена также форма 
записи А+ ул (1--Й)/п, например 0,528 = 0,015. 

Пример У-4. Среди отловленных в природной популяции мух 
Drosophila melanogaster оказалось 539 самцов и 570 самок. Ka- 
кова частота встречаемости самцов в популяции? 

Общее число наблюдений п=539-+570 = 1109. Частота cam- 
цов А = 539/1109 = 0,486. Поскольку пй (1—1) = 207,5 >> 25, воз- 
можна аппроксимация биномиального распределения пормаль- 
ным: Үй(1--й) /п--0,486.0,514/1109--0,015. Построим 95%-ный 
доверительный интервал для частоты самцов р в популяции: 
0.486— 1,96 · 0,015<р<0,486+ 1,96: 0,015. Таким образом, часто- 
та самцов в выборке составляет 48,6% и частота самцов в по- 
пуляции с вероятностью 0,95 лежит в интервале от 45,7 до 
51,6%. Аппроксимация нормальным распределением здесь очень 
хороша: нахождение точных границ дает 45,7 и 51,6%! 


$ 6. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ПАРАМЕТРА ). 
РАСПРЕДЕЛЕНИЯ ПУАССОНА 


Ранее отмечалось, что распределение Пуассона может быть 
представлено через распределение y? (см. гл. ІП, $ 10). Это об- 
стоятельство используется для нахождения доверительного HH- 
тервала параметра à. Приведем без вывода точные формулы 
лля нахождения границ доверительного интервала. С довери- 
тельной вероятностью (1--а) параметр А лежит в пределах 
САС Ав: 


ks Е 72 7а/9 , 
где (2, -- такое значение случайной величины 2 при 
v=2(k+1), что Вук, }=а/2; 
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1 
№ = D 21-002 


где Ү1-о:2 — такое значение %2 при у=2А, что PXE a = 
-- 0/9. 

Пример У-5 (К. А. Браунли [1977]). На самолете, покидаю- 
шем сборочный цех, не хватает одной заклепки (Е=1). Если 
предположить, что число недостающих заклепок на одном само- 
лете распределено по закопу Пуассона, то 99%-ный довери. 
тельный интервал для А (т. е. для среднего числа недостающих 
заклепок на один самолет во всей партии самолетов) находим 
как 


мек те 
М = 75 005 (у=4) = 14 92-- 7.40: 


н = ту Хо (У = 2) = 0,010 2 = 0,005. 


» 


Значения 2 172: берутся из табл. У Приложения. 


Для нахождения доверительного интервала передко пользу- 
ются аппроксимацией распределения Пуассона нормальным; с 
доверительной вероятностью (1--а) 


1 -Гт 1 т 
— — —— 2) е = а ---- ‚о е т 
т F Иа? 7 =<' < труд Ша Ив: 


Условие аппроксимации довольно жесткое: тп>25. 

Пример У-6. Получено распределение островков Лангерган- 
са по отдельным квадратам ткани поджелудочной железы Ма- 
саса rhesus (табл. 25). 

Таблица 25 


Распределение островков Лангерганса 
в поджелудочной железе макаки резус, 72 --900 
(к примеру У-6) 


Число островков Число квадратов 
Лангерганса (^;) ткани (л;) 

0 327 

1 340 

2 160 

З 53 

4 16 

5 3 

0 1 


Предположив, что наблюдаемое распределение описывается 
распределением Пуассона, оценим параметр А. 
Найдем выборочное среднее: 
| 


тест У) хиц--(0:8274-:1-3404-...-6-1)/900--9047900-- 1,00. 
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Так как тп= 9002 25, возможна аппроксимация нормальным 
распределением: үт/и= ү1,00/900= 0,033 и 95%-ный довери- 
тельный интервал будет 1,00— 1,96: 0,033 << 1,00+ 1,96 . 0,033, 
т. е. с всроятностью 0,95 параметр пуассоновского распределе- 
пия находится в пределах от 0,94 до 1,06. 


$ 7. ОЦЕНКА МЕДИАНЫ НЕИЗВЕСТНОГО РАСПРЕДЕЛЕНИЯ 


Несмотря на широкое распространение нормального распре- 
деления в биологии, все многообразие распределений призна- 
ков отнюдь не сводится к нему. Хотя и для ненормально рас- 


пределенных признаков распределение выборочного среднего т 
нередко нормально, его дисперсия обычно неизвестна. Когда у 
исследователя есть сомнения в нормальности распределения ге- 
неральной совокупности, производят выборочную оценку дру- 
гого параметра положения — медианы & (см. гл. ІП, $ 


Пусть х — непрерывная случайная величина с пеизвестной 
плотностью распределения f(x) и $ — медиана распределения. 
Значения независимых наблюдений х], Хо, ..., Хо — случайная 
выборка из геперальной совокупности. Расположим все n зна- 
чепий в порядке возрастания: 


Ха < Хо... < Ха), 
т.е. ранжируем их. В полученном ранжированном ряду 
новый индекс (в скобках) означает порядковый номер, т. е. 


ранг соответствующего наблюдения. Исходя из определения ме- 
дианы Е, естественно определить выборочную медиану Z как 


Е 1 
значение наблюдения, имеющего средний ранг = (п+1). От- 
сюда при нечетном п получим еши при четном и имеем 


2 
1 
Ж —> Хуп -+ X n+l А 
ЕЕ е 
Таким образом, в качестве статистики для точечной оценки 
медианы $ берется случайная величина 


~ 


7 моа HJIH 2 e e | 


Можно получить распределение 2, если известна плотность 
f(x). При п-> оо это распределение аппроксимируется нормаль- 
ным со средним значением $ и дисперсией 0,25. — (0) ]-?, где 
(65) — значение плотности распределения f(x) в точке &. 
Отсюда следует, что если хе М (u; 02), то асимптотически 


т 
2 N (uis 0?). Таким образом, в случае нормального распреде- 
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ления дисперсия выборочной медианы 2 в л/2 раз больше дис- 
персии выборочного среднего т (см. $ 2). Однако, как правило, 


если x распределена ненормально, плотность f(x) в биологиче. 
ских исследованиях не известна. Поэтому для медианы 6 неиз- 
вестного распределения приходится строить непараметрический 
доверительный интервал. Перейдем к рассмотрению такой 
задачи. 

Поскольку медиана Е делит площадь под кривой распреде- 
ления на две равные части, а выборка производится случайным 
образом, то вероятность получить выборочное значение, меньшее 
С, равна вероятности получить выборочное значение, большее 
с. Это соответствует случайному извлечению шара из урны, CO- 
держащей равное количество белых и черных шаров. Поэтому 
если объем выборки п известен, то число выборочных значений, 


мепьших (больших) $, является случайной величиной А, име- 
ющей биномиальное распределение с параметрами р = 0,5 и и. 
Последовательность рассуждений, приводящих к построению 
доверительного интервала для $ с доверительной вероятностью 

(1--а), продемонстрируем для конкретного значения п. 
Пусть п=9. В табл. 26 указаны значения А, соответствую- 
щие всем возможным вариантам расположения выборочных па- 
Таблица 26 


К нахождению доверительного интервала для медианы неизвестного 
распределения при объеме выборки /2=9 


Число А 

выборочных Расположение выборочных значений ПЕРА 

значений, относительно $ Р (шеді) 

меньших $ 
0 өле к 0,002 
1 Ха) SÈS хо) <... < Хо) 0,018 
2 Ха) < Хо) <5<Х3)<... < Хо) 0,070 
3 Xm < Хо) < Ха) <5 < Хау <... < Хо) 0,164 
4 ха) < < Xa) SE <S хр) <... < Хо) 0,246 
5 хер < < 5 << Хр) <...« Хо) 0,246 
6 Ха) <... <Х4) SE < Хо) < Ха) < Хо) 0,164 
7 Xm <... < Ха) < 42-4 Ха) < Хо) 0,070 
8 Ха << Ха) SE Хо) 0,018 
9 чи шиз иа: 0,602 


блюдений относительно медианы и вероятности таких событий. 
Выберем доверительную вероятность (1—0) =0,95. Исходя из 
симметрии биномиального распределения при р=0,5, будем 
строить симметричный доверительный интервал, «отсекая» от 
концов распределения по &/2= 0,025. Начнем с отыскания ниж- 
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ней границы доверительного интервала. Вероятность того, что, 
ни ОДНО ИЗ выборочных значений не попало левее С, т. е. Е--0, 
очень мала: 0,002< 0/2; это означает, что по крайней мере nep- 
вое значение в ранжированном ряду может быть взято в каче- 
стве нижней границы медианы. Вероятность того, что ни одного 
наблюдения пе попало или одно попало левее С, т.е. k< 1, так- 
же мала: (0,002--0,018) <а/2; это означает, что по крайней мере 
второе значение в ранжированном ряду может быть взято в ка- 
честве нижней границы медианы. Однако уже следующий шаг 
р<<2 дает (0,002 -+0,018- 0,070) >0/2. Поэтому в качестве HHX- 
ней границы 95%-ного доверительного интервала для $ прини- 
маем значение паблюдения, номер (ранг) которого равен двум: 
хо, Проводя подобные рассуждения, найдем и верхнюю грани- 
цу: (8). 

Читатель может убедиться, что доверительный интервал при 
(1—0) =0,99 равен Хі)<6 <Хо) а вопрос о величине доверитель- 
пого интервала при (1—9) =0,999 для выборки объема п=9 
смысла не имеет. 


Прн решении биометрических задач нет необходимости вы- 
полнять каждый раз такого рода достаточно трудоемкие по- 
строения. В табл. УП Приложения приведены объемы выборок, 
для которых при заданной доверительной вероятности (1—9) 
указаны номера (b=k+1) ранжированных наблюдений, явля- 
ющихся нижними границами доверительного интервала для С. 
Номер наблюдения, являющегося верхней границей, по симмет- 
рин равен ("6 +1). При больших п (в табл. УП при п>75) 
применяют аппроксимацию биномиального распределения нор- 
мальным: 


1 1 -- 1 
Б = п — из Уп |5; 
1 1 — 
п--8--1--,п-- ia т-Үл---. 


где Uaj, как и раньше, такое значение нормированной нормаль- 
ной случайной величины иғ--М (0; 1), что Рі(шс>и,о|-о/2. 

Пример У-7 (Дж. Вайнберг, Дж. Шумекер, 1979 г.). Опре- 
деляли время прохождения лабиринта крысами, п--17. Полу- 
чены следуюшие (уже упорядоченные) значения (с): 12, 13, 13, 
14, 14, 15, 15, 16, 16, 16, 17, 17, 18, 18, 19, 19, 20. Оценим медиану 
пеизвестного распределения. 

Средний ранг (п+1)/2= (17+1)/2-+9, следовательно, точеч- 
ная оценка медианы есть 2--Х()--16. Найдем 95%-ный довери- 
тельный интервал для $: из табл. УП Приложения находим 
б--5, т. е. нижняя граница есть х(5)== 14; соответственно n—b + 
+1==13, т. е. верхняя граница есть Хаз-- 18. Итак, 14<5<18 с 
доверительной вероятностью 1—а = 0,95. 
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Задачи 


\-1. Найдите оценку максимального правдоподобия параметра р биңо. 
миального распределения. 

У-2. Найдите оценку максимального правдоподобия параметра À в рас. 
пределении Пуассона. 

У-3. Найдите оценки максимального правдоподобия параметров рь 
P2» ..., 1-1 Полиномиального распределения. 


У-4. Покажите, что оценка максимального правдоподобия дисперсии 
нормального распределения 5) является смещенной. Покажите, что несме. 
щенной оценкой является статистика 


жо 1 я AS ~? 
= та a m). 


У-5. Укажите границы доверительного интервала, если выбрана довери. 
тельная вероятность, равная единице. 

У-6. Проведите статистический анализ примера IV-I. 

М-7. Проведите статистический анализ примера ІУ-5. 

У-8. Проведите статистический анализ примера ІУ-7. 

У-9. На 1800 обследованных зарегистрировано 72 больных диабетом, 
Оцените процент заболеваемости диабетом в данном районе. 

V-10. На чашке Петри выросли 42 колонии. Предполагая, что это един. 
ственная реализация пуассоновской случайной величины, оцените параметр ), 

У-11. Постройте доверительный интервал для среднего квадратичного 
отклонения о нормального распределения. 

V-12. На практике встречаются ситуации, когда вместо параметра р 
биномиального распределения требуется оценить математическое ожидание 


пр биномиальной случайной величины х. Постройте соответствующий дове- 
рительный интервал. 

V-13. Постройте доверительный интервал для величины NÀ, где п-- 
объем выборки из распределения Пуассона, а А — его параметр. 


ГЛАВА УІ 


СРАВНЕНИЕ ПАРАМЕТРОВ ДВУХ РАСПРЕДЕЛЕНИЙ 


В этой главе будут рассмотрены задачи, сводящиеся к срав- 
нению параметров двух распределений. Речь идет, как прави- 
ло, © сравнении выборочных оценок, поскольку в` биологии мы 
обычно не можем выдвинуть содержательной гипотезы о зна- 
чении параметров генеральной совокупности и, 0°, А, р. Исклю- 
чение составляют задачи анализа расщеплений в генетике, где 
гипотетические значения параметров биномиального или полино- 


мнального распределений задаются правилами Г. Менделя (см. 
гл. УП 


$ 1. СРАВНЕНИЕ ДИСПЕРСИИ с? И o3 ДВУХ 
НЕЗАВИСИМЫХ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИИ 
Пусть ху и хг — независимые нормально распределенные слу- 
чайные величины; 0? M 02 — соответственно их дисперсии. Пусть 


2 ЖЕН 
8 и $2 — выборочные дисперсии. Требуется проверить пулевую 
гипотезу о равенстве дисперсий Но: 07—02 = 02. Покажем, что 


если Но верна, то случайная величина 5/52 имеет Ғ-распределе- 
ние с числом степеней свободы для числителя у-- --| и для 
зпаменателя Vo= пә —1. 

Действительно, согласно гл. У, 6 2 

(п: — 1)51 7 (2—1) 52 То 


— y2 = 548 0 РНН 
та ті метри Аа а, w= l, 


а 


причем эти случайные величины независимы. Отсюда следует, 
что 


~y g? 9 ~o сета 

---- Х ша, не yt 
о. 
Взяв отношепие случайных величии 5, и 52, убеждаемся соглас- 
но $ 9 гл. ІП, что это отношегге имсет ЁР-распределение: 


9 Зак. № 122 129 


ог. Мер. 
51 БАР 71/У| 


ста Ғ--Е (yi, >). 
52 Хо/ Ма 
Знание закона распределения отношения 5: [52 (когда o? = 
позволяет построить Е-критерий (критерий Фишера) для про 
верки нулевой гипотезы Но: of =0? по выборочному значеник 
Рэксп==52/$2. # 
Пусть верна нулевая гипотеза 02:02. Тогда случайна, 


величина Ғ--51/82 с вероятностью (1--а) принимает зна. 


чение в интервале | Ро (уі, уз), Fa (vi, 2) |, где Ри» (Уі, м) 
и Fuz (Уі, v2) суть такие значения случайной величины Е при 
У И уә, ЧТО Р(Е > Fian (уі 
у)| --1--о/2и P{F > ЕУ, 
у2)} = 0/2, причем Ё,... (vi 
у) < l, а Fap (уі, уә) > 1 (рис, 
39). Мы проводим конкретный 
эксперимент: извлекаем две 
независимые выборочные дис. 
персии 5), 55 и их отношение 
ЕР сп=51 155. Число Ғәкеп есть 


Рис. 39. Двусторонний Ё-критерий. 
Сумма заштрихованных площадей 
равна a. единичная реализация случай. 


ной величины Е с параметрами үу), ух. Если оказалось, что 
Fia (уі, у) <Еэкси< ар (уі, уг), то на уровне значимости а 
нулевая гипотеза принимается. Если же Роко Ро (vi, v) 
или Рок Fa? (vi, уг), то на уровне значимости о нулевая ги. 
потеза отвергается, и мы говорим, что 015205. Покажем, одна. 


ко, что в действительности нет необходимости сравнивать число 
Роке С двумя табличными значениями: Ёо (Vi, v2) н 
Ға» (vi, уз). 


_ Выше (6 7 гл. ІП) отмечалось, что если F~ Fyi, \2), TO 
I/F ~ Е (v2, уі). Следовательно, имеем 
al2 = P [F < Fia W у) = P [E> ИР 2,2 (у, w). 
С другой стороны, по указанному свойству 
Р Е > Fao (>, м)} = 2/2. 
Сопоставляя два последних выражения, получим 
ТЛЕ (Y, Ya) == Fa (уә, 94). 


* Для значений статистик, вычисленных по выборочным (эксперимен- 
тальным) данным, мы всегда будем использовать индекс «эксп». 
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Отметим, что и Е.ә (уі, v2), и Fan (уә, у) больше единицы. Из 
полученного следует, что двойное неравенство 


Буа (Yi, уә) < Fai са Ро (0, v) 
равносильно одновременному выполнению двух неравенств: 
И ер < Fan (71, у) И еи < Fao (Ya, 91). 


Условимся всегда брать в числителе большую из сравни- 
ваемых дисперсий; допустим, что 5: > 52. Тогда Ръксп=5;/52> | и 
второе из указанных неравенств автоматически выполняется. 
Следовательно, для проверки нулевой гипотезы достаточно ис- 
пользовать первое из неравенств и потому иметь таблицы Ғ-рас- 
пределения только для значений Роксо больших единицы (см. 
табл. ГУ Приложения). 

Таким образом, процедура проверки гипотезы о равенстве 
двух дисперсий сводится к следующему. По выборочным дис- 


2 


персиям вычисляется величина Рокс--5,/5:, причем в качестве 
<? всегда берется большая дисперсия, а в качестве $5 — мень- 


шая. Вычисленное значение Forcen сравнивается с табличным 
Е» (уі, v2). На уровне значимости а нулевая гипотеза припи- 
мается, если Рок < Еро (уі, уг); нулевая гипотеза отвергается, 
если Рокси Fa (vi, у). 

Пример \1-1 [Урбах, 1975]. Два сорта пшеницы имеют noy- 
ти одинаковую среднюю урожайность за 9 лет: т, = 20,4 ц/га и 
то-:20,3 ц/га, но один из них как будто более подвержен влия- 
нию изменений погодных условий: 57--16,9; 52 =4,92. Требу- 
ется проверить гипотезу Но: o? ==02. 

Выберем уровень значимости а=0,05. Вычислим Ёс = 
—=51/$5 = 16,9/4,92--3,44; у =у›=8. Обратимся к табл. ІУ, 6 
Приложения, где приведены критические значения Ғо0%5(У1, v2); 
имеем Ро.025 (8,8) =4,43. Поскольку Fuen меньше табличного, раз- 
личие дисперсий статистически незначимо, и нулевая гипотеза 
не отвергается. Таким образом, имеющиеся данные не свиде- 
тельствуют о том, что урожайность первого сорта пшеницы бо- 
лее изменчива от года к году. 


$ 2. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ p, И в, ДВУХ 
НЕЗАВИСИМЫХ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИИ 


Пусть ху И Х-- независимые нормально распределенные 
случайные величины; | и рг — их средние зпачения, а о?и 02 — 
соответственно дисперсии; ті и т; — выборочные средние. Тре- 
буется проверить нулевую гипотезу о равенстве средних Но: 
ш == u= ц. 

Рассмотрим случай, когда 01=02 ==0°, т. е. когда s? и s? 
являются выборочными оценками одной и той же величины 0°. 
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Определим средневзвешенную (обобщенную) оценку Диспер. 
сии 02 следующим образом: 


© = , 

Yi т 72 
где vi =fnı— l; у= п--1. Покажем, что если Н, верна, то в пред 
положении равенства дисперсий случайная величина (т--т)) 
галера имеет /-распределение с у-п + пр--2 степеня. 
ми свободы. 


Гать? Д 


Действительно, Mı и т имеют нормальное распределение 
дисперсиями с: /1 и 02/"2 соответственно. Если o? =0} = 02 y 


верна нулевая гипотеза Но: pi=p2=p, то случайная величина 
(тут) имеет нормальное распределение с нулевым матема. 
тическим ожиданием 
E (т--тз) = и—и2=0 
и дисперсией 
бән с баб ан 2, 2 
D (m, — т.) = Dm, + Dm, = аут, + [по = а (1/1 + 1). 
Следовательно, нормированная случайная величина 


(m, — m.) - Е (т — m) m — то (0: 1). 


м 


Ио в y Пи то 
Далее, >, 52/02 ~ у? (у) и у, 5 а? ~ у? (у,). Поскольку выборки 
т <2/42 42/42 2, 
независимы, новая случайная величина У52/с° == %,51/6° + уҙ52/0 
в силу аддитивности хи-квадрата также имеет у?-распреде- 


ление: у52/2 — у? (у), Y=» Ну == и, — 2 (см. гл. Ш, 6 7), 
Окончательно имеем 


ға” “> ж” 


пт _ ша т- m, Қ | и А. 
_ аалы ое - 2-6) 


Ира. ЗИ + По“ 


Знание закона распределения величины (тұ-т3)І 


/ (Ст +17) позволяет построить [-критерий (критерий Стью- 
дента) для проверки нулевой гипотезы Но: ш = иг. При спра: 


ведливости нулевой гипотезы ЕК). С вероятностью (1—а) 


случайная величина # принимает значение в интервале 
[—t „о (v), Ею (у)|, где, как обычно, #«0(у) есть такое значе- 


ние случайной величины f, что РЕ (у) } = Р -- ta (у)) = 
=0[2 (см. рис. 37). Мы проводим конкретный эксперимент: H3- 
влекаем две выборки, вычисляем выборочные средние и диспер- 
сии и затем величину 
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т, — т; 
s Vijn + ljn 
Цисло Ёкси ЕСТЬ единичная реализация случайной величины 


г Если оказывается, что — 1.2 (у) <ёксп<і,о (v) или |Бкеп| < 
«во (у), то на уровне значимости а нулевая гипотеза принима- 
otca. Если же brer —Ѓа? (у) или Ёзсп2= (v), иными слова- 
ми, если |Ёкеп| 22 (у), то на уровне значимости о, нулевая 
гипотеза отклоняется, и мы говорим, что рро. 

Процедура проверки гипотезы о равенстве двух средних зна- 
цений сводится к следующему. Выборочные дисперсии s? и s? 
сравниваются с помощью критерия F. Если гипотеза Но: 
22--0% принимается, то по выборочным дисперсиям вычисля- 


ется выборочное значение 


Ё кеп = 


$2 — 


По выборочным средним вычисляется >"ачение |Ёеп|== 
= | т--то|/зУ/т + 1/по, которое сравнивается с taz (у- + 
+ т--2). 

Пример \1-2. В табл. 27 приведены результаты зксперимен- 


Таблица 27 


Время наступления паралича (мин) у комнатной мухи при 
воздействии двумя дозами яда (к примеру УІ-2) 


Доза А Доза Б 
Xii УЕ ху Ху уа lg Хо; 
3 0,48 2 0,30 
5 0,72 5 0 70 
5 0,79 5 0,79 
7 0,85 7 0,85 
Q 0,95 5 0,20 
9 0,95 9 0,95 
10 1,00 11 1,15 
12 1,08 18 1,26 
20 1,30 24 1.38 
24 1,38 26 1,49 
94 1,38 26 1,42 
34 1,53 34 1,53 
43” 1,63 37 1.57 
46 1,66 42 1.62 
56 1,76 90 1,95 
140 2,15 


та по действию яда в двух дозах (А и Б) на комнатную муху. 
Определялось время реакции: сколько минут проходит от мо- 
мента соприкосновения мухи с ядом до момента наступления 
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паралича (муха падает). Является ли наблюдаемое различие ву 
времени реакции статистически значимым? 

Обширные материалы по такого рода признакам показывают 
что время реакции не имеет нормального распределения. Одна. 
ко пормальное распределение можно получить, взяв логарифи 
времени реакции: y=lg х. Поэтому будем работать с этим но. 
вым признаком. Имеем п--16; Пә--15. Выборочные средние 
т, =1,219 и т.=1,180. Необходимо сравнить их на 5%-ном 
уровне значимости. Выборочные дисперсии 5'==0,2074 y 
52 =0,1928 не различаются: Роксп-- 1,08 < Ро,оз5 (15,14) = 2,95. По. 
этому вычисляем общую по эксперименту выборочную диспер. 
сию 52--|(16-1):0,2074+ (15—1) . 0,1928] /(16+15—2) --0,2004, 
Вычисляем | кеп | -з|1,219--1,180|/(0,2004ү1/16-- 1/15) =0,24. 

По табл. ПІ Приложения находим, что эта величина много 
меньше 10,25 (у = 29) = 2,05. Таким образом, нулевая гипотеза не 


отвергается: различия между эффектами доз А и Б статистиче- 
ски незначимы. 


Особо следует рассмотреть случай неравных дисперсий. Если 


Е-критерий выявил, что 61-62, то величина у5?/0? уже не имеет 


х?-распределения. Однако специальное исследование показало, 
что случайная величина 


— ~g 


Mı =n то 


и 2-9 ~? 

хъ/ тъ + $2 ло 

аппроксимируется #-распределением, но с числом степеней сво- 
боды v, которое находят из соотношения 


С: ! (1-- С)? 


У1 Мо 


1 ---- 
ще” , 


где 
C s?n 


а 2 ? 
в + 82/1 


т. е. у лежит между меньшим из двух чисел м=п—|и 
у= И — [ и их суммой vı +у= 1 +» + 2. 

Пример \1-3. В двух популяциях нивяника обыкновенного 
измерялась высота растений в сантиметрах. Получены следую- 
щие результаты: Популяция І: 48, 45, 50, 44, 42, 46, 49, 45, 41, 
47, 44, 39, 41, 48, 52, 45, 46, 49. Популяция П: 38, 50, 35, 33, 45, 
31, 54, 39, 39, 43, 47, 40, 35, 42, 45, 38, 35, 39. Значимы ли раз- 
личия между популяциями? 

Объемы выборок м = по-- 18. Выборочпые средние m= 45,6 
и то--40,4. Выборочные дисперсии 5? =11,90 и 52 =36,50. Вы- 


числяем Ё,:спи== 36,50/11,90= 3,07. Табл. ГУ Приложения не co- 
держит у, =у2=17. Ближайшее значение Ро025 (15, 16) =2,79. 
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сно, что тем более Ғәқоп> Ро,025 (17,17), т. е. нулевая гипотеза о 
авенстве дисперсий отвергается на 5%-ном уровне зпачимости. 
Поэтому нельзя вычислять общую для обеих выборок диспер- 


(ИЮ. 
Находим 
| 45,6 — 40,4 | 
t aa дней ИЕ | 
бк | 11,90 36,50 3,17 
| 8 т 15. 

Вычисляем число степеней свободы: С==0,66] (0,66 + 2,03) = 

4452 592 
=0,245; Е == зах zi ТЫУ 0,0374. Отсюда ү--26,7. Табл. Ш 


Приложения не содержит значений і,% для у=27. Однако 
| taxen | > 06,005 (26) = 2,78, поэтому нулевая гипотеза о равенстве 
средних отвергается на 1%-ном уровне значимости. 

Таким образом, популяции различаются и по средней высоте 
растений, и по изменчивости этого признака. 


$ 3. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ ДВУХ ЗАВИСИМЫХ 
НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ (ПАРНЫЕ НАБЛЮДЕНИЯ) 


В биологии довольно часто встречаются ситуации, когда вы- 
борки зависимы. Например, испытания двух лекарственных пре- 
паратов могут проводиться таким образом, что каждый препа- 
рат испытывается на одном и том же животном. При этом, 
естественно, должны приниматься меры предосторожности, что- 
бы действия препаратов не перекрывались. Учитывая индиви- 
дуальность реакции разных особей, такой способ сравнения 
препаратов должен оказаться и более эффективным, поскольку 
нас интересует не сравнение реакции разных особей, а срав- 
нение эффективности препаратов. 

Пусть распределение признака в одном варианте опыта за- 


дается случайной величиной хі, а в другом — Хо. Возьмем слу- 
чайную величину, являющуюся их разностью: д--Х1--Хо, и бу- 
дем полагать, что 4 распределена нормально. Из генеральной 


совокупности разностей д:-- Хи--Хо: произведем выборку объе- 
ма п независимых пар наблюдений (Хц-Х21), (хХ12— 22), ..., 
-a (Хіл--Хоһ). Если согласно нулевой гипотезе, требующей npo- 
верки, средние значения pı и |е не различаются, то 4 ~ М (0; 02), 
где зпачение о? неизвестно, но можно получить лишь ее вы- 
борочное значение 52. Проведем рассуждения, аналогичные рас- 


суждениям предыдущего параграфа. В качестве статистики для 
оценки разности средних (іш--ш) возьмем 


т“ 1 ~ 
Та = D yle 


Очевидно, если справедлива нулевая гипотеза, то 


m~ N (0; 4/ *) 
и, следовательно, 


~ 


ОРІ 
Уп : ( 9 ). 

Поекольку 

(п-1) 52 l 

у) ye Да 

Sd 
TO | 
ата ,5 = Ё Ё(У), Ужп- 1. 


sa Vn -а/п” 9а 


Таким образом, мы приходим к следующей процедуре срав. 
нения парных наблюдений, которая иногда называется парның 


[-критерцем. 
Таблица 
Содержание крахмала (усл. ед.) в картофеле 

(к примеру \1-4) 


Содержание крахмала 


Номер клубня Разность 
(1) метод 1 метод ПІ (4ұ-<і;--0.) 
(44) (=; 
| 21,7 21,5 0,2 
2 18,7 18,7 0,0 
3 18,3 18,3 0,0 
4 17,5 17,4 0,1 
5 18,5 18,3 0,2 
6 15,6 15,4 0,2 
7 17,0 16,7 0,3 
8 16,6 16,9 --0,3 
9 14,0 13,9 0,1 
10 17,2 17,0 0,2 
11 21,7 21.4 0,3 
12 18,6 18,5 0.0 
13 17,9 18,0 —0,1 
14 17,7 17,6 0,1 
15 18,3 18,5 --0,2 
16 16,6 16,5 0,1 


`~ 


По выборочным данным вычисляем разности 4; ==Хи— Ха, 


1 n 
среднюю разность мт. = — 2 „#,(с учетом знакова), выбороч- 


п 


2 1 n 
ную дисперсию S4 = = D; (4; = т)? и, наконец, Гәкг == 
m 
aal И y=n— |. 
за / п 


136 


Пример УІ-4 [Хальд, 1956]. Сравнивались два метода опре- 
деления крахмала в картофеле (табл. 28). Были взяты 16 
клубней с изменяющимся в широких пределах содержанием 
крахмала и к каждому клубню применялись оба метода. Есть 
іи статистические различия между методами? 

Естественно, при сравнении методов не должны учитываться 
азличия в содержании крахмала в разных клубнях. Поэтому 
рассмотрим разности й;=ҳ1:—Хә:. Средняя разность та-- 0,075, 


52 =0,0287 при *=15 и кеп 011011 =1,78, по табл. ІП 


Приложения 10.025 (15) =2,13. Таким образом, нет оснований OT- 
клонять нулевую гипотезу об одинаковой чувствительности обо- 
их методов па уровне значимости о/--0,05. 


$ 4. СРАВНЕНИЕ ПАРАМЕТРОВ p; И р, ДВУХ 
БИНОМИАЛЬНЫХ РАСПРЕДЕЛЕНИЙ 


Необходимо сравнить выборочные параметры й--#/пи 
һо == Во по, Т. е. проверить Но: р, =р.=р. В предположении npa- 
вильности нулевой гипотезы объедипим данные обеих выборок: 
kı +Ег=Е и П--Пә--П и вычислим й--К/п. Здесь оказывается 
эффективной аппроксимация биномиального распределения нор- 
мальным | 


~ ~ 1 
2 РЕ 54 
Và (1) а + иль 


Формула применима при условии, что пй>5 и и; (1—1) 5, 
іг-1,2. Это позволяет, вычисляя изксп, построить критерий значи- 
мости, основанный на нормальном распределении, который мы 
будем для простоты называть и-критерием. Если | иоксп| < Иа, 
то нулевая гипотеза принимается; если | изксо| 220.2 — отверга- 
ется на уровпе значимости о. 

Пример УІ-5. Решим задачу, сформулированную в примере 
ІУ-12 (см. табл. 9). Находим п--69/276-- 0,250, по-- 185/395 = 
--0,468 и (в предположении Но: pi p2) й--254/671- 0,379. Ilo- 
скольку nih= 104,6; п, (1—1) =171,4; пой = 149,7; п2(1— 1) = 
--245,3,-- все больше 5, то возможно использование и-крите- 
рия: Иэксп-- --0,218/0,0380-- —5,73. Поправка на дискретность 
1/(2.671) =0,00075 ничтожна и ею можно пренебречь. Посколь- 
ку |Иәкеп| > №0,0005=3,27, то порода Ван-Скоя более устойчива к 
заболеванию на 0,1%-ном уровне значимости. 

Пример УІ-6 [Бейли, 1962]. В табл. 29 приведены резуль- 
таты лечения редкого заболевания двумя разными методами. 
Что можно сказать об относительной эффективности этих ме- 
тодов? 

Условия аппроксимации биномиального распределения нор- 


— 
є“ 


~ № (0; 1). 
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Таблица 29 


Результаты лечения редкого заболевания двумя методами 
(к примеру У!-6) 


Число больных 


Метод не имевших Итого 


выздоровевших улучшения 


А 4 | 5 
Б 0 | 
Итого... 4 | 5 9 


мальным здесь не выполняются, поэтому приходится прибегать 
к другому способу статистического анализа — точному крите- 
рию Фишера. Рассмотрим таб- 


Таблица 59 лицу 2Ж2 в общем виде (табл. 


К построению точного критерия 30) и проследим, как прихо- 
зишера дит к соответствующему крите- 

я | р | ЕВ рию сам Р. А. Фишер: 
р 4 с+а «Пусть р есть вероятность 
какого-либо события, тогда ве- 
a+c | 5--а | n роятность того, что оно про- 


изойдет а раз в (a+b) незави- 
симых испытаниях, определяется биномиальной формулой 


+ b)! 
an P 


где д=1— р. Вероятность того, что в (с--а) испытаниях оно 
произойдет с раз, есть 


(c+ d)! 
с! D реда. 


Следовательно, вероятность наблюдать в таблице 2X2 числен- 
ности а, b, си а равна произведению 


(а--6!(с--а! a+c b+d 
al bl ага! 4 


и в общем случае она должна быть неизвестной, если неизве- 
стно р. Однако неизвестный множитель, содержащий р и 4, бу- 
дет одним и тем же для всех таблиц, имеющих одинаковые 
маргинальные численности а+с, 5-ға, a+b, с+а. Так что Be- 
роятность любого из возможных наборов наблюдений, имеющих 
одинаковые маргинальные численности, оказывается пропорци- 
ональной величине 


1 
а млад" 
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каким бы ни было значение р, или, другими словами, для лю- 
бых совокупностей, в которых четыре численности находятся в 
пропорциональном отношении. 

Тогда можно найти, что сумма величин 1/(а!5!с!а!) для 
всех выборок, имеющих одинаковые маргинальные численности, 
равна 

п! 
(a+ b)! (ска) (а c)! вал’ 


где n=a@+b+c+d. Таким образом, для данных маргинальных 
численностей вероятность любого наблюдаемого набора входя- 
щих значений равна 
(a+ b)! (c+ а)! (а + с! (b+ d)! | | 
n! a! b! e! а! 


[Фишер, 1958]. 

Вернемся теперь к примеру \1-6. В соответствии с прове- 
денными рассуждениями в табл. 31 приведены все возможные 
варианты таблиц 2Ж2 при постоянстве сумм по строкам и столб- 
цам, соответствующие им вероятности, а в последней строке — 
также соответствующие им разности эффективности методов ле- 
чения Аи Б. 

Таблица 31 


К построению точного критерия Фишера (данные табл. 29) 


Варианты 4 |1 3 12 2 |3 114 |5 

таблиц 2х2 7014. раз ЕРЕ 3 |1 410 
5 4 60 20 1 

Вероятность 196 156 796 126 126 

A—B,% | +80 | 4-35 | —10 | —55 | —100 


Вероятность получить наблюдаемый результат случайно (при 
равной эффективности методов А и Б) равна, таким образом, 
5/126--3,979. Поскольку ранее не было оговорено, что метод 
А не может быть хуже Б, то мы должны учесть и вероятность 
еше большего отклонения, пусть оно и имеет другой знак: 
17126-- 0,79%. Таким образом, вероятность получить случайно 
наблюдаемое или еше большее отклонение от нулевой гипотезы 
равна 6/126=4,76%. Другими словами, лекарство А более эф- 
фективно на 5%-ном уровне значимости. 

На практике нет необходимости проводить подобные вычис- 
ления, достаточно обратиться к табл. УІ Приложения. Находим 
в первом столбце структуру, отвечающую нашему эксперименту: 


4 
в результате прямых вычислений. Если бы в нашем эксперимен- 


а|1 9 
г двигаясь по этой строке, видим, что Р(ас>4)<<0,05, как и 
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те было а=8, это означало бы Р{а—8}=< 0,01. В случае а~; 


имели бы Рат>3)>0,05, т. е. нулевая гипотеза должна была 
бы быть принята. 


$ 5. СРАВНЕНИЕ ПАРАМЕТРОВ à, И 2, ДВУХ 
РАСПРЕДЕЛЕНИИ ПУАССО НА 


Пусть ху и х имеют распределение Пуассопа с параметра. 
ми № И №. По двум независимым выборкам объема пр и по по. 
лучаем оценки параметров Ai: ті и тг. При довольно мягких 
для экспериментатора условиях, а именно т + Т2>5, возмож. 


на следующая аппроксимация распределения Пуассона нормаль. 
НЫМ: 


ри т, -- т. 
u = l ----- (0; 1). 


тт + тата 


Это позволяет проверить Но: № = Хо. Подобпо предыдущему па- 
раграфу получаем критерий, основанный на нормальном распре- 
делении: если |Изьсп| <йао , ТО нулевая гипотеза принимается: 
если |Иоксп| 220.2, то нулевая гипотеза отвергается па уповне 
значимости Q. 

Пример \1-7. Решим задачу, сформулировапную в примере 
ГУ-13. 


Имеем й =иИ2=|; т--42, то--7!. Условие ту - 1225 вы- 


полняется. Поэтому |Мәкеп| = |42--71|/ү42--71--2,73. Так как 
| Мэкси| > й0,005- 2,58, то Но: м-- А отвергается па 1%-ном уров- 
не значимости. 


$6. О СРАВНЕНИИ ПАРАМЕТРОВ НЕИЗВЕСТНЫХ 
РАСПРЕДЕЛЕНИЙ 


Если распределение изучаемого признака ненормально или 
неизвестно, то для сравнения параметров предпочтительно при- 
менение непараметрических критериев, свободных от предполо- 
жения о виде распределения. 

Среди множества непараметрических критериев предпочте- 
пие отдается тем, эффективность которых в случае выборок из 
нормального распределения сравнима с эффективностью пара- 
метрических критериев типа #-критерия для сравнения срелних 
или Ғ-критерия для сравнения дисперсий и остается высокой в 
случае выборок из ненормальных распределений. Под эффек- 
тивностью критерия подразумевается его чувствительность к от- 
клонениям от проверяемой нулевой гипотезы. 

К сожалению, существующие непараметрические критерии 
для сравнения параметров рассеяния значительно уступают в 
эффективности Е-критерию. Поэтому мы рассмотрим лишь два 
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критерия для сравнения параметров положения, которые по 
своей эффективности способны конкурировать с і-критерием: 
критерий Вилкоксона--Манна--Уитни для случая двух незави- 
симых выборок и парный критерий Вилкоксона для случая 
парных наблюдений. 


6 7. СРАВНЕНИЕ ПАРАМЕТРОВ ПОЛОЖЕНИЯ ДВУХ НЕИЗВЕСТНЫХ 
НЕЗАВИСИМЫХ РАСПРЕДЕЛЕНИЙ 


Пусть (Хи, ..., Ха) И (Хо, ..., Хол) — две независимые вы- 
борки объема п; и по соответственно и случайные величины Хи 


и Хо: имеют непрерывные функции распределения Ё, (х) и Ёз (х). 
С помощью критерия Вилкоксона--Манна--Уитни можно про- 
верить гипотезу Но: т-- то, где т; и тг — некие параметры MoJo- 
жения сравниваемых распределений, не обязательно задаваемые 
в явном виде. При этом генеральные совокупности, которым 
принадлежат выборки, не обязательно должны характеризовать- 
ся одинаковыми параметрами рассеяния Ô; H до (рис. 40, а). В Ka- 


Рис. 40. К каким отклонениям от гипотезы Но: Ті = То чувствителен кри- 
терий Вилкоксона — Манна — Уитни? 


а — функцин распределения Ғі(х) и Р,(х) имеют равные параметры положе- 


ния  11=52=- , НО различные параметры рассеяния #?, 20, ; гипотеза Но при- 
нимается; б — Г,(х) стохастически больше /(х), соответственно т)> 1, ТИПО- 
теза Но отвергается; в — параметры положения различаются: T2>Tı, Однако 


F(x) стохастически не отличается от Ғі(х), и критерий Вилкоксона — Манна — 
Уитни может не отвергнуть Но. 


честве альтернативы подразумевается Hi: т5- то, и если, напри- 
мер, т>т1, то говорят, что Е1(х) стохастически больше 
Ғә(х) (рис. 40, б). Именно к таким альтернативам, когда для 
большинства значений х Ё (х) >Е(х) или ЕР, (х)< 
<Ғ;(х), чувствителен описываемый критерий. Критерий этот, 
однако, оказывается малочувствительным к альтернативам ти- 
па изображенной на рис. 40, в, когда одна из функций распре- 
деления попеременно то больше, то меньше другой. 

Обратимся к статистике #-критерия (см. 6 2). В ней в каче- 
стве естественной меры различия двух параметров положения 
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СА мМ. 
Шш И U2 используется разность выборочных средних (ті--т, | 
Заметим, ЧТО эту разность МОЖНО ит в виде | 


Е о E "х у У У” (х Xy, 


T. е. разность двух средних равна среднему всех пп» возможны; 


разностей (х1: —хә;). Это наводит на мысль построить меру раз. 
личия двух параметров положения ті и T2, которая не будет за. 
висеть от вида сравниваемых распределений, если вместо раҙ. 


ностей (Хі:-Хо;) использовать их знаки. Для нахождения знаков 
разностей удобно использовать прямоугольную матриц, 
сравнений, в клетках которой отмечаются знаки (sign) 
ответствующих разностей (табл. 32). 
Таблица % 
Матрица сравнений к построению критерия Вилкоксона— Манна—Уитни 


х 
2 = а z 
Қ / Ха Ха Хоп, 
хи 
Ха sign (хи — Ха) 5ірп (Хит x22) sign (ху — Х,,) 
Х12 sign (х12 — Ха) sign (x12 — х22) * * + Sign (Xp — Ж.) 
Xin Sign (Xin, — Ха) SIgn (Xin, Ха) 1 sign (Xin - Хол.) 


Положительным разностям (Хи--Хо)) >0 припишем знак «+», 
отрицательным (Хи--Хо)) <0--знак «—». Введем две стати: 
стики: (+ — число всех положительных разностей, т. е. число 


знаков «+» в матрице, и U- — число всех отрицательных pas- 
ностей, т. е. число знаков «—» в той же матрице. Соотношение 
этих статистик оказывается достаточно эффективной мерой раз- 
личия параметров положения т! H T2 двух независимых совокуп- 
ностей. Действительно, если тј =т=т (см. рис. 40, а), то 


(++ 0, т. е. должно быть поровну положительных и отрица- 


тельных разностей. Если же тг>т; (см. рис. 40, 6), то /%<0-, 
т. е. число отрицательных разностей будет больше, чем положи- 
тельных. Таким образом, мы сводим задачу сравнения парамет: 
ров положения двух непрерывных распределений + к сравнению 


двух выборочных дискретных случайных величин Ü+ и 0-. 
Статистика 0+ (или 0- ) называется статистикой Манна— 
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Уитни, а соответствующий критерий — критерием Вилкоксона-- 
Манна — Уитни. Ф. Вилкоксон в 1945 г. одним из первых разра- 
ботал этот критерий, основанный на замене выборочных значе- 
ний их рангами. Вслед за ним в 1947 г. Х. Б. Манн и Д.Р. Уит- 


ни предложили статистику U+ и показали, что она идентична 
с точностью до константы) ранговой статистике Вилкоксона. 
Статистика Манна—Уитни есть мера различия таких парамет- 
ров положения т) и тз, разность которых А--т|--тҙ оценивается 


~ 


статистикой А = тей (ху: —Х:;), являющейся медианой всех "17% 


азностей (Хі-Х9)). 

Пример \1-8 (Н. Б. Петров, 1972 г.). Нуклеотидный со- 
став ДНК может быть использован в качестве таксономиче- 
ского признака. Сравним, например, содержание ГЦ-пар ну- 
клеотидов в ДНК беспозвоночных двух родов: Сапсег и Пго- 
ворййа (табл. 33). 

“Таблица 33 


Содержание ГЦ-пар нуклеотидов в ДНҚ беспозвоночных (к примеру У!-8) 


Виды рода Сапсег ^1 | Виды рода Drosophila А 

мол. % мол. % 

С. antennaris 38,4 D. virilis 40,0 

C. borealis 40,2 D. melanogaster 41,2 

С. gracilis 38,4 D. simulans 42,5 

С. irroratus 40,0 р. funebris 38,5 

С. magister 39,4 

С. productus 39,0 

С. oregonensis 40,5 

С. pagurus 38,0 


Составим матрицу сравнений (табл. 34). Можно видеть, что 
на практике встречаются нулевые разности: (Хи--Хо)) =0. В Ta- 
ких случаях говорят, что имеет место совпадение, т. е. Хит- Хо, 

Таблица 34 
Матрица сравнений для данных примера У!-8 


^2} 
40,0 41,2 42,5 38,5 
Нн 

38,4 а = ЕЕ: ыы 
40,2 + = - + 
38,4 -- жш» Е 22 
40,0 + ==. се. -- 
39,4 = 2 352 ще 
39,0 ===; тда =т= + 
40,5 + = Ga Ще 
38,0 -— = ре = 
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Нулевые разности будем обозначать знаком «+». Искомое вы. · 
борочное значение Ut статистики U+ находим суммирова. 


ЭКСП 
нием количества знаков «+>» и половины количества знаков 
«+»: 


Оф п) (се) =7- 05 -< 7,5. 


Zo Статистики U- ест, 


сумма количества знаков «—» и половипы количества знаков 
«+»: 


Соответственно выборочное значение (/- 


Иже е и (—) уп (=)=24 + 0,5 = 24,5. 


Очевидно, что для данных объемов выборок п; и по имеет ме. 
сто соотношение И рев Пе СОЗ. 

Матрица сравнений может принимать различные «значения». 
от матрицы с одними плюсами (когда все Xj; больше всех х;) 
до матрицы с одними минусами (когда все хі; меньше всех Х2)), 
Общее число всех возможных конфигураций такой матрицы 
есть (+72)! / ni!na!, т. е. равно общему числу всех возможных 
сочетаний из Пі значений ху; и по зпачений Хо. Как видим, си. 
туация равносильна подсчету числа всех возможных способов 
извлечения (без возвращения) п, шаров из урны, содержащей 
N =n; +n шаров. 

Если обе сравниваемые совокупности имеют одно и TO же 
распределение, то все возможные конфигурации матрицы срав. 
нения будут равновероятны, и вероятность любой из них равна 
по Дт Вто. Другими словами, если имеет место разенство 


параметров положения ті--тә, то для статистики Ut (или US) 
можно получить распределение вероятностей, которое зависит 
только от п; и По. Для конкретного рассматриваемого нами слу: 
чая (Лі--8, Пә--4) вид этого распределения представлен на 
рис. 41. Здесь на левой оси ординат отложены значения а, т. е. 


сколько раз U+ принимает значения О, а на правой оси орди: 


нат отложены соответствующие им вероятности р,((*) = 


г а’ (пи + по! а: (8-4! а; і B 
ea a жете Ha оси абсцисс указаны зна 


чения (+. 


Можно видеть, что случайная величина + пробегает зна: 
чения от 0 до ппо-- 32; ее распределение симметрично относи- 
тельно среднего значения п1/2-- 16, которое при Но, очевид: 


но, равно математическому ожиданию случайных величин U+ 
и U-: 


1 


ЕЙ —- ЕЦ- = + па, 


to] 
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Заштрихованные области («хвосты» распределения) соответ- 


вуют вероятностям Р(0%<<4)--0,024 и РИ + > 28}= 0,024. Сле- 
г вательно, при л. =8 и и2=4 значения (+ =4 и (/---98 явля- 
ся критическими для уровня значимости a=? . 0,024 = 0,05. 


35-а; р;(0*),%47,0 
30 6,0 
25 | 5,0 
20 | 40 
15 3,0 
Р{0*‹4}-0,024 Р{0*>28} 0,020 
10 2,0 
5 р 1,0 
% 7 1 
i z 
1 2/2 й и: 
0 4 8 12 16 20 24 28 32 
и* 


Рис. 41. Распределение статистики U Манна — Уитни при 
п = 8 H n = 4. - 


Для наглядности дискретные значения представлены B виде едн- 
ничных отрезков на оси абсцисс. Сумма заштрихованных площадей 
есть а = 0,048 =0,05. 


В силу того, что для фиксированных объемов выборок при 


п между значениями Ох и Иж имеет место однозначное 
соответствие, для построения критерия достаточно использовать 
любое одно из них; договорились брать меньшее, т. е. Озкек= 


<< тіп (Оже» Иже). Поэтому таблицы критических значений 
(табл. VIII Приложения) содержат лишь значения U a2 (т, По), 
соответствующие левому хвосту распределения статистики Ман- 


на— Уитни, такие, что Р{0= (7, (пу, п2)} = 0/2.> Таким образом, 


* Заметим, что эти таблицы отличаются от таблиц распределений t, Е 
и 72, в которых значения х,о соответствуют правому хвосту распределения, 


т. с. Ріх>х, ә) = 02 (см. $ 1, 2 игл. V, $ 3—6). 
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если Ока с Ua (пі, Пә), то гипотезу Но отвергают при УРовна 
значимости о; если (коп > Око (Ai, по), гипотезу Но принимают 
В нашем примере (/қоп--7,5 больше табличного значени; 
(0,025 (4,8) =4, и поэтому имеющийся экспериментальный мать. 
риал не дает оснований сомневаться в справедливости гипотезу 
об отсутствии различий в нуклеотидном составе ДНК двух ро. 
дов беспозвоночных на уровне значимости а = 0,05. 
Распределение на рис. 41 напоминает нормальное и отража. 


ет реальное свойство распределения статистики И стремиться к 
нормальному. Это означает, что нет надобности в обширных 
таблицах и для больших объемов выборок (на практике уже для 
п —>и.—8) можно использовать нормальную аппроксимацию 

ай 

и = ----- ~ № (0; 1), 

Үр? 
где 
ерх | ER l 
EOS yh H DU = ye (и, H n + 1); 


Если имеют место совпадения, то статистика U перестает быть 
свободной от распределения (она становится зависимой от не. 
известного распределения совпадающих значений), и критерий 
стаповится приближенным. При этом изменяется (уменьшает. 


ся) дисперсия DU, выражение для ксторой приобретает вид 


` 1 n n. ~S 
--- — А + ДЕ Ү деседе мыз ала СИ оо ода ааа ауа 
DU 19 "а 2 (ил 1) 12 (др - по) (п + по — 1) i=] (с, “ih 


где g — число групп совпадений и с; — число совпадающих зна: 
чений в і-й группе. Совпадениями являются только те случаи, 
когда совпадающне значения принадлежат разным выборкам, 
а группу образуют одинаковые 


хә) по величине совпадающие зна- 

хү; жаа аш; чения. Например, в матрице 
число групп совпадений р--2, 

9 Е 2 Ше А а именно группа «двоек», в KO- 

9 + + торой число совпадающих зна: 

9 Е а Зе чений с1=2, и группа «деся- 


ток», в которой Сә--3; «ч.тоер- 

ки» не являются совпадениями. 

Таким образом, при достаточно больших объемах выдорок 

п и п гипотеза Но: ті--т2 о равенстве параметров положения 

двух неизвестных распределений становится равносильнсй THILO- 

тезе Но: О ~ М(ЕО, DU), которую можно проверить с помощью 
и-критерия. Для этого надо вычислить значение 


| Usxen — EŬ | 
V pù 

H сравнить его с табличным значением 14219. 
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| М әкси | са 


$ 8. СРАВНЕНИЕ ПАРАМЕТРОВ ПОЛОЖЕНИЯ ДВУХ 
НЕИЗВЕСТНЫХ РАСПРЕДЕЛЕНИЙ В СЛУЧАЕ 
ПАРНЫХ НАБЛЮДЕНИИ 
Числитель статистики парного {- критерия для сравнения nap- 
ных наблюдений та = — 2. di (см. § 3) можно привести K сле- 


дующему виду: 
ВНЕ М №" (ара). ixj, 


n(n 1) арр amin] 


1 
т. е. удвоенное среднее равно среднему всех -; п(п+ 1) возмож- 


ных сумм (Фі-ға;), i<j. Поскольку величины 4; являются раз- 
постями парных величин Xj; и х2; и могут принимать как поло- 


жительные, так и отрицательные значения, суммы (4:+4;) Tak- 
же могут быть положительными или отрицательными. Если те- 


перь вместо сумм (di +d;) использовать их знаки, то число по- 


ложительных W+ или отрицательных W- CYMM (di ед i<j, 
может служить статистикой непарамстрического критерия для 
сравнения парных наблюдений, носящего название парного кри- 
терия Вилкоксона. 


Для нахождения сумм (4;+4;), і-|, удобно использовать 
треугольную матрицу сравнений, в клетках которой отме- 


чаюг зчаки соответствующих сумм: sign (4:+а;), і<ј (табл. 
35). Естественно приписать положительным суммам (di+d;)>0 


Таблица 35 
Матрица сравнений к построению парного критерия Вилкоксона 


Tueee 2. жаса. 


ДРЕ до ЭИ Чоду 0р И “заты -4.ө- чо AE 


тали а т. жимастан». “зор жы» O E a талатын. = E «Тита ақтан 


di sign (di -+ d` 

da sign (со + G) sien da -L со 

dn sign (Да + С) sign (4, + 4» sign (4, + da) 
dı də а, 


знак «+», а отрицательным (4:+а;) <0— знак «-». Тогда cra- 
тистика W+ есть число плюсов в такой матрице, а статистика 
У  — число минусов. Их соотношение может служить критери- 
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ем при сравнении параметров положения парных наблюдений 


ті И то. Действительно, если ті--72, то += W-, т. е. число плю. 
сов и минусов должно быть одинаковым. Если же, например, 


п>та, То W+<W-, т. е. минусов будет больше, чем плюсов, 


Статистика парного критерия Вилкоксона W+ есть мера разли. 
чия таких параметров положения совокупности парных наблю. 
дений ті и т, разность которых Л оценивается статистикой 


ка ты ШТІ ет Ж е 1 
А = тей[- (4:+4;)], i<j, являющейся медианой всех = л(п+1) 


У қ қ 
полусумм y (4:+4;). Соответственно парный критерий Вилкоқ- 


сона проверяет нулевую гипотезу о равенстве нулю этой ме- 
дианы. 

Пример \1-9 (Ю. Н. Стройков и др., 1981 г.). У 14 крыс 
замеряли суммарно-пороговый показатель, т. е. значения напря- 
жения электрического тока в вольтах, при котором вызывается 
судорожное сокращение мышц. В табл. 36 приведены получен- 
ные значения показателя до (Х:) и после (Хо) ингаляции Me- 
тилового эфира нитроуксусной кислоты. 

Из табл. 36 видно, что на практике возможны нулевые раз- 
ности 4:=0. Для рассматриваемого парного критерия они не He- 


Таблица 36 


Значение суммарно-порогового показателя (В) у крыс до и 
после воздействия метияовым эфиром нитроуксусной кислоты 
(к примеру \1-9) 


Номе 
оо (i) | xli Хо | а, 
1 5,2 6,5 —1,3 
2 5,8 5,1 +0,7 
3 5,7 5,5 -+0,2 
4 4,0 4,4 —0,4 
5 5,3 6,0 --0,7 
6 4,8 5,9 --0,5 
T 4,5 5,5 ыы 1,0 
8 4,7 5,5 —0,8 
9 6,0 6,6 --0,6 
10 4,8 6,0 —1,2 
11 4,0 4,0 0,0 
12 54 5,1 0,0 
13 45 4,5 0,0 
14 4,0 4,0 0,0 


сут никакой информации и их просто отбрасывают. При этом 
изменяется только обһем выборки, который в данном случае 
становится фактически равным М--п--п(0) =10, где п(0) — ко- 
личество нулевых разностей. 
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Составим матрицу сравнений (табл. 37). В случаях, когда 
имеют место совпадения, т. е. когда 4:=— 4; получаю- 
щимся нулевым суммам (4:+4;=0) будем приписывать знак 


Таблица 37 


Матрица сравнений для данных примера \1-9 
ЕЕ ЕВЕ НН меннен ВЕНЕ ЗЕЕ ЕЕ ВЕРНЕР. 


—1,3 — 

2-0,7 Е + 

О ы ЖЫ жо. ае 

— 0,7 — + — — — 
ЕТНОС ЧИ 

о А деи (02 не | а 

Лас Оо оле ое: А ee СЕЈ С 
06:15 4. 22 30. и 52 ес 25. ы 
2419 бе — = Бра и ка: ко Жк КС 


а 


pa 
е. 


—1,3 +0,7 +0,2 -04 -07 —05 —10 -08 -06 -1,2 


2i 


«+», тогда искомое выборочное значение У: статистики W+ 
есть сумма количества знаков «+» и половины количества зна- 


ков «+»: жп + (+) + п(-+)1/2=6+0,5=6,5, соответственно 


Wren =n (—) +n (+) 1/2--484+0,5--48,5. Очевидно, что для 
данного объема выборки М имеет место соотношение 


Иа + зе = М(М+1) =55. Поэтому для построения 


критерия используют меньшее из этих значений, т. е. Waken = 
я + — 
<< min (1 эссп , Ж ) = 6,5. 
Чтобы оценить значимость полученного результата и = 


--6,5, нужно знать распределение статистики W. Это распре- 
деление моделируется извлечением М шаров из урны, содержа- 
щей равное число шаров двух типов, помеченных, например, зпа- 


ками «+» и «—». Количество матриц только с плюсами равно 
! 


м0! › с одним минусом и т. д., всего возможно 


СУ 10) 1 


N! М! М! N oN 
мг суут + стом =) =? 


вариантов матриц (в примере УІ-9 это 219-- 1024). Если спра- 
ведлива нулевая гипотеза, то все возможные конфигурации 
матрицы равновероятны и вероятность любой из них равна 
(1/2) У, Следовательно, можно получить распределение статисти- 


ки W, которое зависит только от М==и— п (0). Для нашего при- 
мера (М--10) это распределение показано на рис. 42. Заштри- 


хованные области соответствуют вероятностям P{W <8}=0,024 
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что при №=10 значения 


8 являются критическими для уровня значимости 


0,024. Это означает, 
2. 0,024 =0,05. 


и Р(У—47} 


Т 


47 и W= 


(2 
о. 


—ы 


Для статистики ІР парцого критерия Вилкоксона имеются 


apa; 
1 


30 
25 


20 


\ 


4 


15 
p 
10 


|:0,02 


{W<8 


Рис. 42. Распределение статистики W парного K 


—ы 


ритерия Вилкоксона при 


М = 10. 


Для наглядности дискретные значения представлены в виде единичных отрезков на 


‹ = 0,048 = 0,05. 


оси абсцисс. Сумма заштрнхованных площадей есть 
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таблицы критических значений И.» (№), таких, что Р < 
<Wa2 (№) }= 9/2 (табл. ІХ Приложения). Как обычно, исполь- 
зование таблиц сводится к тому, что найденное по выборке 
значение Уп сравнивается с табличным Wao (М). Если 
ксп Ў 2 (М), гипотезу Но отвергают на уровне значимости 
а: в противном случае ее принимают. 

В данном примере У. и=6,5< оо. (10) =8, и мы склоня- 
емся к выводу, Что влияние примененного воздействия на нерв- 
ную деятельность крыс статистически значимо при а= 0,05. 


Вернемся к рис. 42. Можно видеть, что W принимает значе- 
ния от 0 до + М(М+1) =55, ее распределение симметрично OTHO- 


сительно среднего значения L М(М+1) =27,5, которое при Но, 
очевидно, равно математическому ожиданию случайной величи- 
ны W: 

ЕЎ = М(А--1). 


Ее дисперсия есть 
DŠ=4N(N +1) (20У 1). 


При наличии совпадений критерий становится приближен- 
ным и выражение для дисперсии принимает вид 


y 1 | x 
Р =: М(М+ (2N +1) – а * (=c), 


48 adj 


где g — число групп совпадений, а с; — число совпадающих зна- 
чений В 1-Й группе. Совпадениями являются только те случаи, 
когда 4:=— 4; т. е. когда разности одинаковы по абсолютной 
величине, но противоположны по знаку. 
При больших N (практически при №М>25) величина 
W — ЕШ 
V př 
имеет приблизительно нормальное распределение М (0; 1). 
Таким образом, при достаточно большом объеме выборки 
гипотеза Но: т-- та о равенстве параметров положения для Nap- 
ных наблюдений из неизвестной генеральной совокупности CTA- 


Шаш 


новится равносильной гипотезе Но: --М(ЕМ, DW), которую 
можно проверить с помощью и-критерия. Для этого надо вычис- 
лить значение 


| Шэкеп | | Woxen Е ЕЯ | 
Уря 


и сравнить его с критическим значением и, . 
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Задачи 


\1-1 [Тьюки, 1981]. В 1942 г. Дж. Билл сосчитал число особей пасеко. 
мого Phlegethontius quinquemaculata на делянку после применения различ. 
ных способов борьбы с ним. Результаты для двух способов выглядят так: 

способ I: 0, 1,7,2, 3, 1, 2, 1, 3, 0, 1, 4; 

способ Il: 3, 5, 3, 5, 3, 6, 1, 1, 3, 2, 6, 4. 

Число особей па делянку имеет распределение Пуассона, какое преобразо. 
Banne данных следует применить (см. гл. УШ, $ 6)? Какой из способов 
борьбы с насекомым более эффективен? Примените критерий Стьюдента и 
критерий Вилкоксона — Манна — Уитни и сравните полученные выводы. 

М1-2 [Снедекор, 1961]. Фермер тратил на удобрение поля А по одному 
фунту стерлингов на акр, а поля Б — по два фунта. Чистый доход на акр 

в течение 5 лет с этих полей (Не 

Таблица 38 учитывая стоимости удобрений) при. 

веден в табл. 38. Имеет ли смысл 

продолжать применять усиленное 
удобрение? 

УІ-3. Как вы будете обеспечи. 


Чистый доход на акр в течение 5 лет 
(к задаче \1-2) 


422 вать простой случайный выбор (про. 
toa A | Б водить рандомизацию) в примере 
VI-6? 

| 170 180 М1-4 [Ван дер Варден, 1960) 
' , С 1946 по 1951 г. в медицинской 

2 о а клинике Цюрихского университета 
3 1,0 24,0 для лечения последствий тромбоза 
Е о о образования сгустков крови в крове. 


посных сосудах — 252 раза применя. 
лись антикоагулянты. Из 252 паци. 
ентов умерли 14. С 1937 по 1945 г, 
антикоагулянты вообще не применялись. Оказалось, что из 205 пациентов, 
лечение антикоагулянтами которым было бы не противопоказано, умерли 
74. Можно ли благотворность действия антикоагулянтов считать статисти- 
чески значимой? 

\У1-5. Проведите статистический анализ дапных из примера ІУ-8. 

УІ-6. Проведите статистический анализ данных из примера ІУ-ІІ. 

VI-7 (H. В. Железнова, 1980 г.). Для производства вирусных вакцин 
необходимо подавить инфекционную активность вирусных частиц, не изменив 
их иммунологических свойств. Орудием для такого «нежного убийства» 
является ультрафиолетовое излучение. С этой целью изучена фоточувстви- 
тельность двух штаммов вируса гриппа и получены следующие данные 
(см/1015 квант): 

штамм «Техас-77» (12 опытов): 0,23, 0,27, 0,28, 0,28, 0,29, 0,29, 0,30, 
0,31, 0,31, 0,32, 0,33, 0,34; 

штамм «СССР-77» (5 опытов): 0,34, 0,36, 0,42, 0,43, 0,50. 

Различаются ли штаммы по чувствительности к УФ-свету? 

У1-8 (А. П. Пуговкин, 1982 г.). Изучали регуляцию тонуса кровеносных 
сосудов. Для этого подопытное животное (кошку) подключали к системе 
искусственного кровообращения, замеряли артериальное давление (милли- 
метры ртутного столба) — Xii, затем прерывали и вновь возобновляли кро- 
воток, повторно замеряя давление — Хо: (табл. 39). Можно ли говорить 
о восстановлении артериального давления? 


У1-9 | Фишер, 1958; Крамер, 1975]. В табл. 40 приведены данные, заим- 
ствованные из классической работы Стьюдента 1908 г. о #-распределении. 
По этим данным требуется проверить, существует ли значимая разница 
между действием двух снотворных средств А и В, если предположить, что 
разность между дополнительными часами сна, вызванными действием этих 
двух средств, распределена нормально. 

М1-10. Используя известное соответствие между #-распределением и Е- 
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Таблица 39 
Артериальное давление у кошки (к задаче УІ-8) 


даа a ТТІ... ИН О И Е ИО 
Бау Номе 

в. (i) | хи 22 EAO (1) хи о |а feo] w | e 221 
1 80 85 10 90 89 
2 90 77 11 90 85 
3 90 95 12 90 88 
4 90 70 13 80 70 
5 90 80 14 80 65 
6 100 85 15 90 90 
7 70 75 16 90 99 
8 70 70 17 90 110 
9 70 70 18 90 110 


Таблица 40 


Дополнительные часы сна у десяти пациентов, вызванные 
действием двух снотворных средств А и В (к задаче \1-9) 


Разност 
Пациент (7) Средство А (хр) Средство В (Хор (х) 
1 1,9 0,7 1,2 
2 0,8 — 1,6 2.4 
3 1,1 -- 0,2 1.3 
4 0,1 --1,2 1,3 
5 --0,1 — 0,1 0,0 
6 4,4 3,4 1,0 
7 5,5 37 1,8 
8 1,6 0,8 0,8 
9 4,6 0.0 4,6 
10 2,4 2,0 1,4 


`- 
- 


распределением (см. $ 10 гл. ІП), постройте статистику РҒ-критерия для 
сравнения средних значений ш и | двух нормальных распределений, когда 
0195. 

М1-11 [Большев, Смирнов, 1982]. В группе из 25 человек 20 человек бы- 
ли подвергнуты действию противогриппозной сыворотки, и в течение шести 
месяцев из них лишь 6 человек заболели гриппом. Остальные пятеро от вак- 
цинации отказались, и среди них наблюдались четыре случая заболевания 
гриппом. Убеждают ли эти результаты в благотворном действии испытывае- 
мой сыворотки? Удовлетворительна ли такая постановка эксперимента? 


ГЛАВА VII 


СРАВНЕНИЕ РАСПРЕДЕЛЕНИЙ 


В этой главе мы рассмотрим сначала задачу проверки согла. 
сия эмпирического распределения с полностью определенным ги- 
потетическим. Даиная задача, встречающаяся при анализе рас- 
щеплений в гепетике, позволяет аккуратно ввести критерий х“. Да. 
лее обсуждаются задачи проверки согласия эмпирического рас- 
пределения с гипотетическим дискретным, параметры которого 
оцениваются по выборке, и сравнения нескольких выборочных 
дискретных распределений. Эти задачи также сводятся к приме- 
непию критерия х2. Затем обсуждается задача согласия эмпи: 
рического распределения с гипотетическим непрерывным нор- 
мальным распределением. В этом случае мы предпочитаем ис- 
пользовать негруппированные данные и применять непарамет- 
рический критерий Колмогорова. 


2 


$ 1. СОГЛАСИЕ ВЫБОРОЧНОГО РАСПРЕДЕЛЕНИЯ 
С ПОЛНОСТЬЮ ОПРЕДЕЛЕННЫМ ДИСКРЕТНЫМ 
РАСПРЕДЕЛЕНИЕМ 


Пример Vil-1 (Г. Мендель, 1865 г.). При скрещивании двух 
чистых липий гороха, одна из которых имеет желтые семена с 
морщинистой поверхностью, а другая — зеленые с гладкой по- 
верхностьо, в первом поколении получены растения, все горо- 
шины на которых были желтыми и гладкими. Во втором поколе- 
пин, полученном в результате самоопыления, обнаружено pac- 
щепление: 315 горошин были желтыми гладкими, 101 — желтой 
морщинистой, 108 — зелеными гладкими и 32 — зелеными MOPD- 
щинистыми. Общее число независимых наблюдений равпо 
315--... --32--556. 

Формулируется простейшая гипотеза: различия между ис- 
ходными линиями определяются двумя генами, которые комби- 
нируются независимо. Один ген, определяющий различия 
по окраске семян, имеет доминантную аллель, обусловливаю- 
щую зеленую окраску, и рецессивную аллель, обусловливающую 
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желтую окраску. Другой ген, определяющий различия по фор- 
ме семян, имеет доминантпую аллель, обусловливающую глад- 
кую форму, и рецессивную аллель, обусловливающую морши- 
нистую форму. | 

Если эта гипотеза верна, то во втором поколении гороши- 
ны желтые гладкие должны появляться с вероятностью 9/15, 
желтые морщинистые и зеленые гладкие — соответственно с ве- 
оятностями 3/16 и 3/16 и, наконец, зеленые морщинистые — с 
вероятностью 1/16. Это позволяет вычислить ожидаемые чис- 
ленности всех классов семян. 


Таким образом, в эксперименте получены эмпирические чис- 
ленности классов 315:101:108:32; на основании законов Мен- 
деля найдены гипотетические (ожидаемые) численности 
219,75: 104,25 : 104,25 : 34,75. Требуется проверить согласие 3M- 
пиричуских соотношений с гипотетическими. Заметим, что Mell- 
делевская гипотеза приводит к полностью определенному рас- 
пределению. В самом деле, проведено п-- 996 независимых испы- 
таний, каждое из которых имеет четыре несовместных исхода с 
постоянными от испытания к испытанию вероятностями р, =9/16, 
p= рз==3/16, р4=1/16, причем р, + р2+ рз-+ р4=1, т. е. мы име- 
ем полиномиальное распределение (9/16+3/16+3/16- 1/16) 5°. 

Сформулируем теперь этот тип задачи в общем виде. 


Пусть результатом некоторого испытания может быть одип 
из 1 различных попарно несовместных исходов А), А» ..., А, 


так что событие ИА; есть достоверное событие. Вероятность 
нсхода А; обозначим через р; и будем считать ее известной. 
Производится п независимых испытаний, в Е, из них мы га- 
блюдаем событие Аі, в Еә--Аә ит. д. Общее число всех испыта- 


ний из А. Исходя из гипотезы, что вероятность каждого со- 
бытия А; есть Pi, можно вычислить, сколько раз в и испытаниях 
ожидается каждый исход эксперимента: пр, про, ..., пр. Необ- 
ходимо проверить согласие ожидаемых (гипотетических) числен- 
ностей классов пр; с наблюдаемыми численностями Ri. 


Для того чтобы решить эту задачу, нужно предложить меру 
расхождения между гипотетическими и змпирическими 
данными. Представляется естественным рассмотреть отклонения 
наблюдаемых численностей от ожидаемых суммарно по всем 
классам А, А»... А. Однако Ур 1 (Е--пр;) =0. По аналогии 
с выборочной дисперсией можно попытаться рассмотреть сум- 
му квадратов отклопений 3a (ki—np:)?. Но эта величина, oye- 
видно, будет зависеть и от числа классов |, и от объема выборки 
п. Поэтому должны быть введены некоторые коэффициепты 
(пормирующие множители): Х1-16:(Б-пр3)2. Что выбрать в Ka- 
честве с? К. Пирсон предложил брать с;--1/прі. Тогда мера 
расхожления между гипотетическими и змпирическими данны- 
ми (или мера согласия между ними) принимает вид 
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¿t (А; — пр): 
а —1 пр: 


«Хорошая» эта мера или «плохая»? Ответ зависит от того 
удастся ли найти распределение предложенной статистики y 
на его основе построить критерий значимости. Попытаемся эт 
сделать. 

Для упрощения задачи будем рассматривать частный случая 
полиноминалъного испытания — биномиальное, в котором воз. 
можны лишь два несовместных исхода А, и Аз==А,. Bepon 
ность Р{А!} исхода А; обозначим рі, РА) = рг, так что р +р,= 
—=1. Производится п независимых испытаний, в каждом из ко. 
торых рҙ--сопві, i=l, 2, причем в А, испытаниях происходит 
событие Д, в Ро испытаниях — событие А» и В1--Еә--П. 

Тогда предложенная мера согласия принимает вид 

(ki с. ари: y kop 
пр! пра 


Отклонения (Е--пр.) и (Еә-прә) линейно связаны: 
(к--пр) + (Ю--прг) = (kı +k2)—n (pı + p2) =0 


H 
(Е-прі)----(б--пр2). 
Тогда 
(kı — пр у (А — пра)! | о [1 1\_ 
пр, T np, (kı — пр) (% T тт) та 
г: ы ә (Po +P) (б-арұ): 
= (ki — np) арг = ТО 


Уменьшив числитель по абсолютной величине на 0,5 (поправка 


на дискретность) и рассматривая Е, как случайную величину, 
распределенную биномиально, получим случайную величину 


вй | — пр, | — 0,5 
И = — 
V np, (1 — pi) 


которая, согласно результату, приведенному в гл. ІП, $ 5, при 
П-» со будет иметь нормированное нормальное распределение 


М (0; 1). Тогда по определению (гл. ІП, $ 7) случайная вели- 
чина 


(|А пр 0,5): ОСКАР (|5, пр:| 0,5), E 
TEA «Е. пр; ала. 


Зтот результат можно обобщить на полиномиальное распре- 
деление, при этом поправка на дискретность (0,5) не использу- 
ется. Совокупность | отклонений 
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ғ“ 


k, — ПР: __ ё, — пр. Ri — пр 
Vap Sp) уто( 1 -р) 07” Үлр((-р) 
можно представить в виде (1—1) независимой случайной вели- 
чины Ui № (0; 1). Тогда 


ще 1 (% Ж Y 
ГЕ і пр; дер = 
х^ = у р ӘЛ ы. 


:—1 


Поскольку закон распределения статистики, предложенной 
К. Пирсоном, установлен, можно построить критерий значимо- 
сти ye (критерий Пирсона). Сформулируем нулевую гипотезу 
Но: имеет место согласие между гипотетическим и змпириче- 
ским распределениями; альтернатива Н, заключается в том, что 
эмпирическое распределение не описывается гипотетическим. 

При правильности нулевой гипотезы значения ха o, , вычис- 


ленные по экспериментальным (выборочным) данным, не 
должны превосходить критическое значение х2 (у), такое, что 


— 


P2 æy? (у)} =. Поэтому если ха <2(*), т. е. 
ра а > а, то нулевая гипотеза принимается на уровне 


значимости а. Если ха Xa (У), т. е. Руа! <<а, то Hy- 


ат. Зари «төл» 23 


левая гипотеза отклоняется и принимается альтернативная. 
Так обычно поступают, 
когда речь идет о мере со- 


5 f(y?) 
гласия между какими-та с 


распределениями. Такой 

способ построения критерия a 

2 Š ---- --- я 5 
(2 приводит к односторон- ө үу еее 


нему по своей сути крите- 


рию (рис. 43). Односторон- Рис. 43. Односторонний критерий 77. 
ним он является потому, 


что статистика критерия не учитывает знаков отклонений «на- 

блюдаемых» от «ожидаемых», т. е. знаков разностей (Еҙ-пр;)). 
2 2 

Если ха < (У), то при описании экспериментальных pe- 


зультатов принято указывать не просто Р(у%2>у2 т )>а, НО 
более точное значение вероятности, что можно сделать, поль- 
зуясь табл. У Приложения. В таблице приведены и очень боль- 
а. 
шие значения P(X >72 5„| и даже такие, как 0,975 и 0,995. 
Это связано с обстоятельством, на которое впервые обратил вни- 
мапие P. А. Фишер. Если вычисленное значение х2 очень 
мало, то это приводит к очень большим значениям Р |,22>Х2 а) 


и свидетельствует об очень большой вероятности согласия ги- 
потезы с экспериментальными данными. Однако в то же время 
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это означает, что вероятность случайного отклопепия эк‹ порц, 
ментальных данпых от гипотетических значений Ру }ы 


<1--Ру >52, } очень мала, т. е. получено слишком хоро. 


шее согласие с гипотезой Но. Разумеется, такие значения из. 
редка могут появляться и случайно. Экспериментатору нужно 
это обстоятельство просто иметь в виду и при систематическом 
получении малых значений хо а еще раз просмотреть структуру 


и технику эксперимента с целью обнаружения факторов, искус. 

ственно снижающих случайную изменчивость. Таковыми могут 

быть, в частности, субъективизм в оценках, необосноваинос от. 

сеивание (выбраковка) «нежелательных» результатов и т. п. 
Мы пришли к выражению 


L m 2 
`y (2, — пр!) — у? (>), jan os 1, 


i=l] пр; 


в предположении, что п-» со. Возникает вопрос, при окашах 
үсловиях на практике эта аппроксимация правомочиа. Посколь- 
ку в знаменателе стоят пр, дело сводится к минимально допу. 
стимым значениям ожидаемых численностей. Точного решения 
этой задачи нет, однако ее всестороннее обсуждение привело к 
эмпирическому правилу, которым и пользуются в биометрии: 
минимальное ожидаемое не должно быть меньше 5. Если ожи- 
даемое оказывается слишком малым, приходится объединять 
соседние (обычно крайние) классы, соответственно уменьшая 
число степеней свободы. Эта процедура, естественно, влечет за 
собой уменьшение чувствительности критерия. 


Ряд исследователей все более склоняется к точке зрения, 
что требование минимального ожидаемого меньше 5 является 
слишком жестким и что допустимое минимальное ожидаемое, 
вообще говоря, зависит от числа степеней свободы. :Широкле 
распространение получила следующая рекомепдация: если чис- 
ло степеней свободы больше 6, то одно из ожидаемых может 
спижаться даже до 1/2. При числе степепей свободы, равном 60 
и более, и при малых ожидаемых критерий y? очепь надежен. 
При 2 степенях свободы ожидаемое может снижаться до 2. 
Только при | степени свободы нужно соблюдать осторожность и 
требовать, чтобы ожидаемое было не меньше 4. 

Распределение ху? — это непрерывное распределение. Мы же 
рассматриваем задачу о согласии с полиномиальным, т. е. диск- 
ретным, распределением. Однако при соблюдении указанных вы- 
ше ограничений на минимальное ожидаемое дискретпость не 
: риводит к сколько-нибудь существенным погрешностям, за 
одним исключением: когда число степеней свободы равно еди- 
пчце. Для этого случая Ф. Иейтсом была указана очень простая 
поправка, дающая удовлетворительные результаты: абсолютные 
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значения разностей между наблюдаемыми и ожидаемыми не- 
обходимо уменьшить на 0,5. 

Пример УП-1 (продолжение). Ожидаемые численности уже 
были вычислены выше. Имеем 


222 (315- 312,75): (32 — 34,75)? _ 
Faxen — 8975 К.Б T 0,47. 


По табл. У Приложения при у= /—1==3 находим хо, (3) =7,81, 


которое больше Xen . Таким образом, PX Œ X2. }2 0,05, сле- 
довательно, наблюдаемое расщепление не противоречит выдви- 
нутой гипотезе при уровне значимости о = 0,05. 

Отметим, что статистика критерия Пирсона может быть пре- 
образована к виду 


ад 1 


2 
2 1 | Ті 


А та n, 
2—1 Pi 


который более удобен для вычислений в случае, когда pi крат- 
ны целым числам. 


$ 2. СОГЛАСИЕ ВЫБОРОЧНОГО РАСПРЕДЕЛЕНИЯ С ДИСКРЕТНЫМ 
РАСПРЕДЕЛЕНИЕМ, ПАРАМЕТРЫ КОТОРОГО ОЦЕНИВАЮТСЯ 
ПО ВЫБСРКЕ 


Обратимся к данным задачи 1-11. Сопоставление эмпириче- 
ского и гипотетического распределений графически показывает 
их явное расхождение. Решим эту задачу точно с помощью кри- 
терия 77. Отличие ее от задачи, обсуждаемой в $ 1, заключается 
в том, ЧТО нам неизвестно точное значение параметра гипотети- 
ческого распределения Пуассона ÀA, мы можем вычислить лишь 
его оценку m= 0,205. 

Можпо показать, что при проверке согласия с распределени- 
ем, параметры которого оцениваются по выборке, мы также име- 
ем распределение ê, но с числом степеней свободы, меньшим 
па число оцениваемых параметров. Например, в рассматривае- 
мом случае проверки согласия с распределением Пуассона чис- 
ло степеней свободы будет равно (/—1) —1. Если проверять 
согласие с нормальным распределением, среднее значение p и 
дисперсия о? которого оцениваются по выборке, то у= (1—1) —2. 

Пример УП-2 (продолжение задачи 11-11). Ожидаемые ync- 
ленности для клеток, имеющих более двух поврежденных хро- 
мосом, очень малы (см. решение задачи). Поэтому необходимо 
объединить численности четырех последних классов, тогда 
[==3 и у=3—1—1= 1. Вычисляем значение 


ə __ (877— 814,7): | (63 — 167,01: | (60—183): 12. 
Хъксп — 814.7 + 1670 + 183 = 164,55, 


которое существенно превышает критическое табличное значение 
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Ха (1) =10,8. Следовательно, Ра, =164,55}<0,001, 
Таким образом, нулевая гипотеза о согласии наблюдаемого рас- 
пределения поврежденных хромосом по клеткам с распределе. 
инем Пуассона должна быть, несомненно, отвергнута. 


$ 3. СРАВНЕНИЕ НЕСКОЛЬКИХ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИИ 
(КРИТЕРИЙ ОДНОРОДНОСТИ) 


Пример УП-3 (Г. И. Арнаутова, 1982 г.). Природные попу- 
ляции Primula sibthorpii полиморфны по окраске цветка. Встре. 
чаются растения с четырьмя типами окраски: белые цветки (не- 
окрашенные), светло-сиреневые, сиреневые, фиолетовые. В табл, 
41 приведены распределения этих растений по окраске цветков 
в трех популяциях Дагестана. 

Таблица 4| 


Распределение растений P. sibthorpii по окраске цветка в популяциях 
Дагестана (к примеру УП-3) 


Окраска цветка 


Попу Вс 
ео. белая | а сиреневая | фиолетовая Щи, 
Дылым.... 1529 177 211 45 1962 
Сыртыч ... 725 360 348 89 1522 
Маджалис .. 182 354 252 99 887 
Всего. 2436 89 | 811 233 | 4371 


Необходимо решить, различаются ли популяции по часто- 
там растений с разной окраской или наблюдаемые различия 
между популяциями носят случайный характер, определяемый 
объемом выборки. Другими словами, совпадают ли распреде- 
ления генеральных совокупностей, из которых извлечены вы- 
борки? 

Сформулируем задачу в общем виде. Пусть т. (читается: «эн 
один с точкой») объектов первой выборки разбиты по какому- 
то признаку на l классов и пусть Юи, Rig ..., Ки — численности 
объектов в этих классах. Следующие по. объектов второй вы- 
борки разбиты на те же / классов и Ао, Ёо, ..., Ко — численно- 
сти соответствующих классов и т. д. Наконец, численности в l 
классах для Nr, объектов г-й выборки равиъ kri, Rro, ..., Ги. Bce- 
го получено rl чисел, которые расположим в прямоугольную таб- 
лицу (табл. 42). Справа приведены суммы по строкам (выбор- 
кам), внизу — по столбцам (классам признаков), тогда точка в 
индексе при п.‚ указывает на суммирование по всем выборкам 
для числа особей, имеющих признак, соответствующий і-му 
классу. 


Таким образом, имеем г выборочных полиномиальных рас- 
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Таблица 42 
Таблица сопряженности FX / к построению критерия однородности 


ku k2»... Rki 2... Ри n. 
Ror Р. А Во; ооо Ra; По. 
Ел kj „Ал .. А Ир 
Ел 8ю... Ко kri | Пу. 
пу По п.) п.) n 


пределений и нужно проверить, могут ли параметры рь, рә... 

‚ р быть одинаковыми для всех строк. Наилучшими выбо- 
д0" пыми оценками значений р; являются частоты классов, опре- 
делспные по всем выборкам (см. гл. V, $ 1): 


п. Ма п. 
h=, h,=, аз Девета, 

где А: — выборочная оценка вероятпости pi. Поскольку изве- 

стен объем каждой выборки, теперь можно найти ожидаемые 

числепности классов. Например, для первой выборки оги будут 

равпы па. hi; ni-ho; ...; П.В. Точно так же поступаем для второй 

ит. д. выборки и, наконец, для г-й выборки. 

Вычитая из каждого наблюдаемого соответствующее 
ожидаемое, вновь приходим к прямоугольной таблице от- 
клонений (Рл--п;.ің) (табл. 43). Суммы по строкам и суммы по 
столбцам в этой таблице, естественно, равны нулю, что следу- 
ет использовать для проверки правильпости вычислений. 


Таблица 43 
Таблица отклонений к построению критерия однородностн 


(ғ же? п.п) 


ki 1,1 kyo — Л, „По ... И... kyy = 131 
Ро == по Р; Коз - п! ... рә; — по ə Aj o.. Ral = n» 1 
kj — пт. kia — nj. ħ . Ви пу e. œ рр nj hi 
ka — nr hi Е — ilr ha 2... Rri np hi 2... Ви nhi 


Аналогично рассуждениям 8 | можно показать, что сумму 
ксадратов разностей между наблюдаемыми и ожидаемыми, де- 
ленных па соответствующие ожидаемые 


пу. Р; пу. По n,. hi i 
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можно рассматривать как реализацию случайной величины 2 
с числом степеней свободы у= (7—1) (1—1). Действительно, все. 
го наблюдается rl зпачений численностей. Объем каждой выбор. 
ки фиксирован, т. е. на эти г! паблюдений наложено г линей. 
ных связей: 


Ра + Кю + приза += я 
Кроме того, было оценено (/—1) параметров р; (число оценен. 


ных параметров равно /—1, а пе l, поскольку р+р+ ... + 
+ т-+ 1). Тогда число степеней свободы будет равно 


ү-гі-г-(І-1)-(ғ-1) (1—1), 


т. е. произведению числа строк без единицы на число столбцов 
без единицы. Заметим, что й;.й;=и;.п.:/п, т. е. для того чтобы 
пайти любое ожидаемое, необходимо произведение сумм по со- 
ответствующим строкам и столбцам разделить на общую сумму 
наблюдений. 

Пример УП-3 (продолжение). Прежде всего вычислим ожи- 
даемые: для численности 1529 имеем 2436. 1962/4371 = 1093,4: 
для 177 имеем 891 · 1962/4371 = 399,9 и т. д. и, наконец, для 99 
имеем 233.887/4371==47,3. Все они больше 5, следовательно, 
можно применять критерий у2. Тогда 
о __ (4529 — 1093,4)? , (177- 399,0): (99 — 47,3): 4 
Ken 1093,4 + 599,9 H.+ 4,7322 205,14. 


По табл. У Приложения при у= (3—1) (4—1) =6 находим 
Хо! =22,5, которое существенно меньше уа. Следовательно, 


— ә 25 
РО22>55,а ==905,14}<0,001. Таким образом, распределения pa- 
степий по окраске цветка в разных популяциях, песомненно, 


различны. 
Заметим, что более удобной для вычислений является фор- 


мула 
Е огч Fi 
нды 


согласно которой сначала для каждой строки вычисляют зна- 
чения 8;2/п., суммируют их по i и каждую ј-ю сумму делят 
на fj.. 

Рассмотрим в заключение этого параграфа вопрос о сумми- 
ровапии значений статистики хи-квадрат и вопрос об аппроксн- 
мации х2-распределения нормальным. 

Пример УП-4 |Бейли, 1962]. При отработке методики под- 
счета дрожжевых клеток в счетной камере четырьмя лаборан- 
тами были проведены независимые эксперименты, в которых 
исследовалось распределение клеток по квадратам счетной ка- 
меры. Если суспензии клеток приготовлены правильно, т. е. 
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каждая клетка отделена от другой, так что пе образуется ком- 
(ов, ТО эмпирическое распределение не должно отличаться от 
аспределения Пуассона (см. гл. П, $ 4). Результаты статисти- 
ческого анализа этих экспериментов приведены в табл. 44. 


| 


Таблица 44 


Проверка согласия распределения дрожжевых клеток 
по квадратам счетной камеры с распределением Пуассона 
(к примеру УП-4) 


Лаборант | а У Р (2 > ии 
А 17,32 13 01 
Б 14,71 10 0,1 
f 94,45 17 0,1 
Г 14,68 - 9 0,05 
Сводные данные ... 71,36 40 0,025 


Как видно, ни в одном случае пет оснований отклонить ну- 
левую гипотезу, т. с. следует вывод о согласии эмпирических 
распределений с распределением Пуассона. Правда, обращает 


на себя внимание близость всех значений P >72, } к уров- 


ням значимости &«==0,10 и а= 0,05. 

Однако такой анализ не использует всей информации, содер- 
жащейся в эксперименте: анализировалась работа каждого ла- 
борапта ипдивидуально. Поскольку экспериментаторы работали 
независимо, можно продолжить анализ, объединив , ззуль- 
таты. Вспомним теорему сложения для распределения y? (см. 
гл. ПІ, $ 7) и на ее основании просуммируем все значения хо 


и числа у степеней свободы. Для суммарных данных (нижняя 
строка в табл. 44) Р(у%->у2 1 }<0,025, т. е. при 2,5%-ном уров- 
не значимости нулевая гипотеза должна быть отклонена. Если 
кто-то сочтет выбранный уровень значимости слишком мягким, 
следует провести дополнительные эксперименты, ведь речь идет 
об отработке методики! Полученные же результаты позволяют 
заподозрить, что у всех лаборантов имеют место какие-то не- 
большие, но систематические погрешности (возможно, одинако- 
вые) в приготовлении суспензии клеток. 

Не во всех статистических таблицах содержатся критические 
значения хо при 49 степенях свободы. Однако при у> 30 можно 


воспользоваться аппроксимацией распределения х2 нормальным 
(см. гл. Ш, $ 7). Тогда 


taxen = V 22 — V Xy — 1 = V 2-71,35 — У9.49--1--2,10, 


что меньше #025 = 1,96. Таким образом, Р{и>> Ucn} < 0,025, т. е. 
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имеем тот же результат (ведь аппроксимируется распределени, 
статистики одностороннего по самой своей сути крите. 


рия!). 


$ 4. СОГЛАСИЕ ВЫБОРОЧНОГО РАСПРЕДЕЛЕНИЯ 
С НОРМАЛЬНЫМ 


Удобным способом проверки согласия выборочного распредь. 
ления с гипотетическим пепрерывным распределением является 
применение так называемой вероятностной бумаги (сетки). Наи. 
большее распространение получила вероятностная бумага для 
проверки нормальпости выборочного распределения. Нормаль. 
ная вероятностная бумага — это специальным образом сконст. 
руированная координатная сетка с таким выбором масштаба 
по оси ординат, что график функции нормального распределе. 
ния изображается прямой линией (рис. 44). По оси абсцис 
масштаб берется равномерным, а по оси ординат — неравномер. 
ным, вероятпостным, «выпрямляющим» график функции пор- 
мального распределения (ср. с рис. 17). Нормальный вероят. 
ностпый масштаб симмстричен относительно точки 0,5: (50%). 
вверх и вииз от этой точки цена деления резко уменьшается, 
В пределах от 20 до 80% цена деления составляет 2%; в пре. 
делах от 1 до 29% нот 80 до 99% цена делепия равна 1% п за 
этими пределами --- 0,1%. 

В биологических исследованиях практически не возникает 
задача сравнения выборочного распределения с полностью опре- 
делепным нормальным. Обычно выборочное распределение срав- 
нивается с гипотстическим нормальным, параметры которого 
оцениваются по той же выборке. Использование вероятностной 
бумаги в этом случае заключается в следующем. 

Пусть по выборке объема п из нормально распределенной ге- 
неральпой совокупности вычислены выборочное среднее т и вм: 
борочная дисперсия 52. По оси абсцисс на вероятностной бу: 
Marc откладывают значения признака, охватывающие весь диа: 
пазон выборочных наблюдений. На графике отмечают три TOY- 
ки, имеющие координаты (Хі-т, у=50%), (х=т- 1%, 
Ya=97,72%) и (хз=т— 2$, уз- 2,089). Если все технические 
операции были выполнены верно, то эти три точки должны ле- 
жать на одной прямой, которая соответствует функции гипоте- 
тического нормального распределения Ғо(х) с параметрами 
по== т, с: = 52. Теперь необходимо построить в том же вероят: 


постном масштабе выборочную функцию распределения Ра (х). 
Для этого производится ранжировка выборочных значений — 
находят Хау. Ожидаемые для нормального распределения значе: 


ния у= Е|Еа (х) | с вполне достаточной точностью можно вы: 


і — 0,3175 я 
где і-- номер (ранг) на: 


числить по формуле Ya= 7203600” 
i 9 UU 
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блюдения хо и п — объем выборки. После этого на график Ha- 
носят точки с координатами (хи, у). 
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Рис. 44. Нормальная вероятностная бумага. 


Пример УП-5 (М. В. Падкина, 1978 г.). Определялась KOH- 
станта Михаэлиса--Ментен Км (10-3 М) для кислой фосфатазы 
дрожжей Saccharomyces cerevisiae: 


2,17 1,92 2,20 2,08 1,85 2,00 2,08 2,00 2,12 
1,96 1,92 2,00 1,83 2,00 2,08 1,92 1,75 1,96. 


Согласуется ли выборочное распределение`с нормальным? 
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Объем выборки п = 18, выборочное среднее т = 1,99, выбо. 
рочное среднее квадратичное отклонение $ = 0,118. Абсциссь 
трех точек для построения графика РҒо(х) суть х= 1 ‚99. 

=т-+25=2,93 и хз=т—25==1,75. Ранжируем все 18 наблк. 
дений, получая Ги ха» и вычисляем Ya (табл. 45). Наносиу 
точки (Ха, Yu) на вероятностную бумагу. 
Таблица 45 


К проверке нормальности выборочного распределения 
(к примеру УП-5) 


е 

= 
— 
-., 
— 


yup 5% 


1 1,15 3,1 

3 1,83 9,2 

3 1.85 14,6 
4- 6 1.92 20,1--30,9 
1-- 8 1,96 36,4—41,8 
9—12 2.00 47,3--63,6 
13—15 2,08 69,1 —80,0 

16 2,19 82,5 

17 2,17 90,8 

18 2,20 92,3 


Теперь возникает вопрос о согласии эмпирического распре- 
деления с гипотетическим. Нередко, когда видны систематиче- 
ские различия, достаточно глазомерного сравнения. Однако в 
общем случае, конечно, необходимо иметь количественную меру 
согласия распределений и соответствующий критерий значи- 
мости. 

Такой критерий был найден А. Н. Колмогоровым в 1933 г. 
Пусть Е(х) — произвольная, но полностью определенная функ- 


ция распределения непрерывной случайной величины хи 


Г. (х) — случайная выборочная функция распределения. В ка- 
честве статистики для критерия согласия между эмпирическим и 
гипотетическим распределениями А. Н. Колмогоров выбрал слу- 


чайпую величину Dn=sup| Ри (x)—F (x)| (см. $ 1 гл. ТУ). Было 


показано, что Р(үпО,<2)-- К(А), 22>0, при п оо, где К(М)-- 
функция распределения Колмогорова, для которой найдено ана- 
литическое выражение. Лишь 45 лет спустя (в 1978 г.) Г. А. Не- 
сепепко и Ю. Н. Тюрину удалось найти асимптотическое рас- 
пределение статистики критерия Колмогорова для случая, ко- 
гда параметры Ғ(х) оцениваются по выборке. В частности, бы- 
ло получено решение для нормального распределения с неиз- 
вестными параметрами u и с. На практике достаточно знать два 
критических значения статистики: В0,5-- 0,899 и Воо = 1,035, с 
которыми сравпивается величина, въчислепная по эксперимен- 
тальным данпым: 
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Вокеа-- Dn (Үл-0,01--0,85/Үп). 


Итак, проверяется гипотеза Но: Е [Ри (х)|--Ео(х) =0 о согла- 
син эмпирической фупкции распределения Ға(х) с гипотетиче- 
ской функцией нормального распределения Ғо(х), параметры 
щий с. которой оцениваются по выборке (==, 0% ==52), Hy- 
зевая гипотеза принимается 
на уровне значимости о, €C- 69-Е (т) 
ли Poren <L Ва, И отклоняется, НЕ 


ЧАР М 
если Воцсп> Ва, ГДЕ Во такое, С | 
что Р Ве Ва = а. Критерий 90 о 
Колмогорова в изложенном РА 
виде применим и для малый А 
выборок. лии 

Примей УП-5 (продол- ШЕШ MA ВУ 
жение). Выборочное значе- 40 
ние Dn можно достаточно 
точно установить по графи- 20 о 
ку на вероятностной бума- 0} 
ге. В данном примере мак- : 
симальное по абсолютной ҚЫ; К 
величине отклонение выбо- “ 5 4 х1) 


рочной функции распределе- 0 10 19 200 20 2,20 
ния от гипотетической при- 

надлежит значению Х(оу-- 

—? 00 и составляет О, = о ВВ нормальности рас- 

И ПО ы - 
=0,106 (рис. 45). Находим ной бумаги и критерия Колмогорова. 
значение Baren = 0,106 (718-- Указано наблюдаемое значение статистики 
-0,01--0,85//18) = 0,470. По- РЫ, Для данных примера УП-5. 
скольку Вәксп< Во,05, ТО на 
уровне значимости а ==0,05 нет оснований отклопять гипотезу о 
нормальности выборочпого распределения. Следует, однако, за- 
метить, что для более надежных выводов требуется анализ вы- 
борки большего объема. 


Задачи 


УП-Т (В. П. Эфроимсон, 1956 г.). В табл. 46 представлены результаты 
опытов Г. Менделя и его последователей по изучению наследования одного 
признака — окраски семядолей — у гороха. Согласуются ли результаты раз- 
ных авторов друг с другом и с ожидаемым расщеплением 3: 1? 

\П-2. Проверьте согласие с нормальным распределением данных приме- 
ра 1\-1 (см. табл. Зи 6). 

ҮП-3. Проведитс статистический анализ данных из примера ІУ-6 (см. 
табл. 7). 

VII-4. Проведите статистический анализ данных из примера ІУ-12 (см. 
табл. 9). 

7 “е Проведите статистический апализ данных из примера ІУ-14 (см. 
таол. А 
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Таблица 46 


Расщепление по признаку окраски семядолсй у гороха 
(к задаче УП-1) 
Го мам кк тн ен т нее плотник, чье ЛЕД резнет мәй 


Расщепление во втором поколении 


- дах да 
Авгор 
число желлых (А) | число зеленых (а) 
ое ое и о расы 
| 

Мендель 6 022 | 9001 
когренс 1:94 | 453 
1 012 344 
299 70 
Чермак 3 580 1 120 
о 000 959 
Херст 13:0 445 
Бэтсои 11 902 3903 
Локк | 1438 514 
3 052 1003 
2409 950 
Дэрбишир 109 069 36 185 
1059 374 
5 652 1 556 
Уайт 1 647 543 
ее и 102529 50 676 


ҮП-6. Прозедите статистический анализ данных из примера ГУ-19 (см, 
табл. 15}. 

УП-7. Чему равно число степеней свободы при проверке согласия с би: 
номпальным распределением при неизвестном значении р? 

ҮП-8 (Дж. Э. Юл, М. Дж. Кендэл, 1960 г.). Число рождений в Англии 
и Уэльсе по месяцам в 1941 г.: январь — 50 159, февраль — 45 885, март-- 
50 819, апрель — 49 070, май — 50 771, июнь — 46 788, июль — 49 395, азгуст— 
50445, сентябрь — 51 562, октябрь — 50 224, ноябрь — 47 168, декабрь — 
50 529 (всего зарегистрировано 592 813 рождений). Выявляют ли эти данные 
наличие некоторой сезонности в рождениях? 

ҮП-9 (Н. В. Тимофеев-Ресовский, Қ. Пэтау, 1943 г.). На протяжении 
ряда лет проводились эксперименты по изучению радиационно-индуцирован- 
ного мутационного процесса у дрозофилы. Особенно большие материалы Ha- 
копились при облучении самцов дозой 3000 Р: всего было проанализировано 
29600 хромосом! Эта выборка включала 148 последовательных субвыборок 
по 200 хромосом в каждой), полученных в хронологическом порядке на про- 
тяжении семи лет. Полученное авторами распределение представлено в 
табл. 47. 

Если условия эксперимента были воспроизводимы, то вероятность на- 
ступления события «мутация» должна быть постоянной на протяженни всего 
опыта. В этом случае должно быть получено согласие с биномиальным рас- 
пределением. Проверьте это. 

УП-10. Почему при построении графика выборочной функции нормаль- 
ного распределения на вероятностной бумаге (см. рис. 45) берутся три, а не 
две точки? Почему избранным при этом трем значениям х;: т, (т-+ 2$) и 
(т—25) — соответствуют значения Yi: 50, 97,72 и 2,28%? 

У11-11. Проверьте гипотезу о равномерном распределении для показа- 
ний часов, выставленпых в витринах часовшиков (см. задачу ІУ-6, табл. 21). 
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Таблица 47 


Результаты рентгеновского облучения самцов дрозофилы 
дозой З КР (к задаче УП-9) 


Число Число | Число Число 
хромосом субвъбопок | хромосом субвыборох 
6 | 19 9 
7 2 | 20 8 
8 0 сөз 6 
9 2 | 22 9 
10 5 | 23 | 6 
11 7 i 24 | 5 
| 3 25 i 6 
13 9 | 25 | 2 
14 8 | 27 2 
15 9 ) 98 1 
16 10 н 29 0 
1 17 | 90 | 
18 20 Н | | 


| 
| 

УП-12. Проверьте, согласуются ли с нормальным два выборочных pac- 
пределения из примера У1-2 (см. табл. 27). Действнтельно ли преобразова- 
ние lg X в данном случае является нормализующим? 

УП-13. Для данных задачи \[-| графически, с гомощью нормальной 
всроятностной бумаги, проследите, как изменяется вид двух выборочных 
функций распределения после нормализующего преобразования. 

УП-14. Проверьте выдвинутое Стьюдентом предположение о нормальшо- 
сти распределения для разности между дополнительными часами спа, вы- 
званными двумя снотворными (см. задачу УІ-9, табл. 40). 

УП-15. Ч. Дарвин“ приводит результаты многолетних наблюдений раз- 
личных авторов за соотношением полов у домашних животных (табл. 48). 
Согласуются ли эти данпые друг с другом? Можно ли считать, что соотно- 
шение полов у домашних животных соответствует предполагаемому 1:1? 


Таблица 48 
Соотношение полов у домашиях животных (к задаче УН-15) 


Животные Число самцов Число самок 
Лошади еее... 12 763 12 797 
Собаки еа 5 ізі ада 3 605 3 273 
ОВЦЫ 7535 за е а а 29 478 30 172 
КОРОВЫ" иле ж и еве 477 505 
ПҮрвЕ” 5 ұза а а 487 514 


УП-16. Для эмпирического распределения 26 306 бросаний 12 игральных 
костей (см. задачу П-9, табл. 1) проверьте гипотезу о согласии его с бино- 
мнальным распределением, параметр которого равен р= 1/8. Если гипотеза 
будет отклонена, проверьте согласие с гипотетическим биномиальным рас- 
гределением, параметр которого оцените по выборке. 


* Дарвин Ч. Соч., т. 5. Происхождение человека и половой отбор. 
М., Изд-во АН СССР, 1953. 
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УП-17. Для двух распределений числа наводнений в устье р. Невы (см, 
задачу ГУ-12, табл. 24) проверьте гипотезу о согласии их с распределеннеу 
Пуассона. 

УП-18 (Б. П. Ушаков, 1981 г.). Согласуется ли с нормальным распре, 
делением распределение личинок мухи Calliphora erythrocephalia по тепло. 
устойчивости мышц при 42°C (табл. 49)? Согласуется ли распределение ло, 
гарифма теплоустойчивости с нормальным распределением? 


Таблица 49 


Распределение личинок мясной мухи по теплоустойчивости при 42°C 
(к задаче УП-18) 


сам | ок Том О Рем оо 
Хр мин | n; ЕЛЛЕСИКСЛЕСИКЕЛ | а. хр мин п} Хр МИН | п, 
: 
9 3 | 20 10 и 5 
10 б 21 7 о 
1] б | 29 11 33 о 
19 т | B 9 34 5 
13 6 | 24 7 35 3 
14 8 25 7 36 о 
15 19 26 7 37 э 
16 7 57 5 38 2 
17 2 | 58 6 46 | 
18 40050009 3 48 1 
19 19 | 30 3 
1 


ГЛАВА УШ 


СРАВНЕНИЕ ПАРАМЕТРОВ НЕСКОЛЬКИХ 
РАСПРЕДЕЛЕНИЙ 


Сравнение параметров нескольких распределений проводится 
с помощью дисперсионного анализа, которому и посвящена 
большая часть этой главы. Однако дисперсионный анализ по- 
зволяет решать и другую важную задачу, пе рассматриваемую 
в элементарном курсе биометрии, — разложение дисперсии на 
компоненты; мы сочли пеобходимым упомянуть об этом в $ 4. 
Последний параграф посвящен изложению непараметрического 
метода дисперсиоипого анализа с помощью критерия Круска- 
ла — Уоллиса. 


$ 1. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ: МОДЕЛЬ 1 


Биологическая задача сравнения параметров пескольких нор- 
мальных распределений сформулирована в примере [У-15. Ме- 
тод решения подобного рода задач был найден Р. А. Фишером 
и носит название Оисперсионного анализа. Однако если поста- 
новка задачи такая, как в примере 1У-15, где речь идет о срав- 
нении нескольких выборочных средних, то становится непо- 
нятным, почему метод получил название дисперсионный 
анализ или, при дословном переводе апглийского analysis of 
variance, анализ дисперсии? Тем не менее здесь все верно. 
Сравнение средних производится путем анализа (разложения 
на компонепты) общей дисперсии. 

Пусть k независимых выборок объема п каждая извлечены 
из нормально распределенных геперальных совокупностей с 
равными дисперсиями: 01==0. = ... =02 =0?. Иметь равное 
число наблюдений в каждой выборке желательно для простоты 
организации эксперимеита. Такой план эксперимента называ- 
ется сбалансированным в отличие от несбалансированного пла- 
на с выборками неравного объема. Каждое паблюдение xij, где 
і-- номер выборки (сорта в примере ІУ-15), а ј — номер повтор- 
ности (делянки в примере ГУ-15), будем рассматривать как ре- 
ализацию случайной величины 
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Xij = + е 


где р: — среднее значение і-й генеральной совокупности, 


е;; N (0; 0?) — независимые случайные величины, имеющив 
нормальное распределение с параметрами 0 и с“. 


Случайная величина е;; называется случайной ошибкой (слу. 
чайным отклонением) или просто «ошибкой». Она характеризу. 
ет изменчивость впутри 1-й совокупности (обусловленную, на. 
пример, случайными различиями в составе почвы, влажности, ка. 
честве семян, индивидуальном развитии растений и т. п.). 


Таким образом, мы рассматриваем однофакторный диспер. 
сиоппый анализ, где фактор в нашем случае — это сорт, оң 
представлен Е уровнями (число сортов). 

Отметим, что в сформулированной задаче сравнения К сор. 
тов р; — не случайные величины, а некоторые константы; такая 
линейная статистическая модель называется мо- 
Солью с фиксированными эффектами, или моделью Г. В этой 
модели нулевая гипотеза припимает вид 


Но: === ... == ы. 


Модель І дисперсионного анализа можно записать и по- 
иному: 


~ 


и и ры 
Ху-- ЛЕМІ е, 


| в 2 
где р== 7 У. м — общее среднее для всех k генеральных 


совокупностей; @i= р;—– р — отклонение среднего значения 1-й 
генеральной совокупности от общего среднего u; очевидно, что 


г е я Мк. 
У оса; е5 ~ N (0; с?) имеет прежний смысл случайной ошибки. 
В этих обозначениях нулевая гипотеза принимает вид 


Но: озон... =аһ= 0. 


Пспользуя метод максимального правдоподобия, можно по- 
казать, что несмещепными и эффективными оценками парамет- 
ров модели являются статистики: 


н | k n 
— — — У 
ӨЗІМДІ Шат ақ >, 17577 
м2 1 qn — 
ДЛЯ w — т = ГОЛИ Му 
для о4-- т-т, 
где N=nk. 
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Рассмотрим тождество 


Перепесем т в левую часть: 


2-” 


Хр т = (т; — т) + (Ху-- т), 


розведем обе части в квадрат: 


~? ~d — м — ~A 
ә 


(xy т)? = (т, —– т)? +2 (m, — т) (ху — m) + (Хр -– т.) 
и просуммируем обе части уравнения по ]: 


п 


Ре а а 
ЭЗЕ" (Ху — т)? = п (т, —т)? Тет — т) У" (0 т + 
T Э МЕ. — т). 
~e 1 ~ — т“ = ~ 
Однако Mi= (Ха Хт... 4 Xin) поэтому e (ху- та) =0, 


т.е. второй член в правой части уравнения равен нулю. Просум- 
мпруем обе части уравнепия по г: 


21-1 >, „(Фи m) та да т) T2 a 2: (у= м)". 
В левой части данного уравнения мы имеем сумму квадратов 
отклонений случайных величин Xij от общего для всех выборок 


среднего т. Это так называемая общая, или полная, сумма 


квадратов, которую мы будем обозначать SS.. 
Первый член в правой части — сумма квадратов отклонений 


выборочных средних каждой группы (уровня, выборки) т; от 
общего выборочного среднего т. Это сумма квадратов между 
группами ($5). 

Накопец, второй член в правой части — сумма квадратов от- 
клонений Xij от среднего своей группы Mi. Эту величину назы- 


вают суммой квадратов внутри групп ($$). 

Итак, полная сумма квадратов разложена на две аддитив- 
ные составляющие — суммы квадратов между группами и вну- 
три групп: 

55; = 55, + 55. 


Каждую из суммы квадратов необходимо теперь связать с CO- 
ответствующим числом степеней свободы. 
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Общая сумма квадратов 55, основана на N=nk наблюдени. 
ях, па которые наложена одна линейная связь: при вычисле. 


НИИ $5, использована оценка общего среднего т, поэтом 
уж М--1. Апалогично мь=А— | И vw = (и 1) = М. Заметим, 
что 

УЕ == Vb E Уи), 


Сумма квадратов, деленная на соответствующее число сте. 
пеней свободы, называется средним квадратом:* 


MS, ES М, = 29 я 


tw 


В нашей модели предполагалось, что внутригрупповые вы. 
борочные дисперсии суть оценки о?. Если это так, то внутри- 
групповой средний квадрат есть взвешенная по отдельным груп. 
пам оценка 02: 


n а —\2 п е“ Х-12 n ~ ~ 2 
ях Сит Rr Сит. 


“ (п-- 1) т (п — 1) --...-- (п — 1) 


~v 
s? 
i 


где 52 — дисперсия і-й выборки группы). Поскольку эта оцен- 


ка является песмещенной, то Е(М5,) 30. 
Можно показать, что 


Е(М5,) = ЕЕ — а 


Следовательно, если пулевая гипотеза верна, то Е(М5ь) == 
=Е(М5,). Если же нулевая гипотеза неверна, то Е(М8,)> 


>Е(М85,). 
Таким образом, проверке поки свой гипотезы СВОЯ К рас- 


смотрению соотношения М5 М5ь. Поскольку Е(М5ь) 20°, а 


Е(М5,) = 9, то отношение MS/MS» может принимать значе- 
ние меньше едипицы лишь в двух случаях: 1) случайно, вслед- 


ствие слишком малых отклопений выборочных средних т; от 
общего среднего значения и; 2) при неадекватности рассмат- 
риваемой модели экспериментальным данным. 


* Для сумм квадратов и средних квадратов традиционно используются 
двухбуквенные обозначения, являющиеся сокращениями английских выраже- 
ний sum of squares (SS) и mean square (MS). 
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Мы уже пеодпократно пользовались тем, что случайная ве- 


(n— 1) $2 ~ 
ичина -- их (y), у=п—1. Для 52 это можно предста- 
вить B виде 
772 — мо 
(п = 1) 5; 47 (z; — т; Ж 
с? БЕ ры 22 зук За еті, 
Био 


2 =E и? (Yeh Фа =N — k, ИЛИ 


—. 


Обратимся теперь к MSs. Имеем k случайных величин M, ~ 


дк (и; s Vn H m= — L m.. Тогда 
і? 3 ) R 4—1 1 
м2 — 9 ~v — 9 м2 -ло 
“о КОИ (т, — ) т. — т) L т,--т) КИЕР 
/% меди s'in + 2 + в... | safn == 
| <” ы о о 
== — % п (т, — т)? ~ у° ( =k] 
E Е ( i ) 2; (3. 4: , 
или 73 = SS, о? КР (у), у= — 1, и, поделив обе части на 


число степеней свободы у,, 


р -- MS, 07, 


Итак, 


ғ. 


М8, и ТА Ур 
М5, ЕРІТЕ 


~ Ё (уь, Ур: Ўр, Уг 


поскольку можно показать, что уг H х-, суть независимые CY- 


чайные величины. 

На этой основе можно построить критерий значимости Е 
для сравнения средних значений нескольких независимых нор- 
мальных распределений (с равными дисперсиями). Если пуле- 
вая гипотеза верна, т. е. ш==ро== ... --рһ-р, то статистика 


критерия Е- М5,/М8, будет иметь Ғ-распределение с парамет- 
рами vi=vo = k— l и у2==у,=М— К. Поскольку, как было пока- 


зано выше, Е(М5,ь) > Е (МЗ), критерий является односто- 
ронним. Вычислив значение 


MS, 


Foren = 75. › 
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его сравнивают с критическим значением Fa(vi, vo), У =, 
) 


Үз--Уш, таким, что РІҒо>>Ғо(уі, У2)}== 0. Если Ғәкса<Ғо(У1, vg 
то нет оснований для отклонения гипотезы Но и различия ме. 
жду средними признаются незначимыми на уровне о. Если 
Еэксп—Ёа(У1, v2), то нулевая гипотеза отклоняется, т. е. по 
крайней мере одно из А сравниваемых средних значимо отлича. 
стся от остальных. 


Подведем итог приведенным выше рассуждепиям. 


Сформулировав в статистических терминах задачу „сравне. 
ния средних значений, возникающую в биологическом экспери. 
мепте, мы построили линейную статистическую модель, огово. 
рив условия ее выполнения и указав статистики для оценки па. 
раметров модели. Далсе было проведено разложение полной 
суммы квадратов и полного числа степеней свободы. Для полу. 
чаемых затем межгруппового и внутригруппового средних квад. 
ратов указаны их математические ожидания; при этом оказа- 
лось, что при правильности нулевой гипотезы величина М5] 
ІМ, вычисляемая по экспериментальным данным, является pe- 
ализацией случайной величины, имеющей Р-распределепие. Это 
позволило построить критерий значимости Е. 


Таким образом, разлагая общую дисперсию на компо- 
ненты и сравнивая их, оказывается возможным решить задачу 
сравнения k выборочных средних. 


$ 2. ТЕХНИКА ВЫЧИСЛЕНИЙ В ОДНОФАКТОРНОМ 
ДИСПЕРСИОННОМ АНАЛИЗЕ 


Вычисления в схеме однофакторного дисперсиопного анали- 
за удобно проводить в следующей последоватсльности: 

1. Общее число наблюдений N=nk, где Е — число групп 
(выборок, уровней), п — число наблюдений в каждой группе. 

2. Полная сумма наблюдаемых значений б--УРА УА Xij. 

З. Корректирующий член С == 62/М., | 

4. Полная сумма квадратов отклонений 55,5171; —С. 

5. Сумма квадратов между группами 


SSe =+- У (Хах? С. 


. Сумма квадратов внутри групп 55,==55:—5$. 
. Числа степеней свободы у: = М— 1, vo=k— 1, у= М--К. 
Средний квадрат между группами М5==55ь/%ь. 
. Средний квадрат внутри групп М5,ш--55.ш/Уш. 

10. Экспериментальное значение статистики Ё-критерия 
Е,кеп--/М5,/М85,. 

Результаты однофакторного дисперсионного анализа удобно 
представлять в виде таблицы (табл. 50). 


OONO 


176 


Таблица 50 
Таблица однофакторного дисперсионного анализа с фиксированными 
эффектами (модель Г) 


Сумма Число степе- 
квадратов пой свободы 


Средний Е 
квадрат эксп 


ы реа насаа ааа два онгоны 


Изменчивость 


между группами ... SS, k— 1 М5, М5,М8, 
Внутри групп ..... мы М--Р М5. — 
Полная ........ 55; М-1 = 2% 


Проведем вычисления для данных примера IV-15: 


1. У--5 Х4--20. 

2. 6--656,4. 

3. С=21543,05. 

4. 85; = 21725,22—21543,05 = 182,17. 

5. 55,--21677,50--21543,05-- 134,45. 

6. 55,--182,17--134,45-47,72. 

7. үрт-4--І--3; Уш--20--4-- 16; у)--20--І1--19. 
8. М5, = 134,45/3 = 44,82. 

9. М5,=47,72/16= 2,98. 


10. Роксп-- 44,82/2,98-- 15,03. 
Результаты анализа представлены в табл. 51. 


Таблица 51 
Результаты дисперсионного анализа для данных примера ІУ-15 


Сумма Число степе- Средний 
Изменчивость квадратов ней свободы квадрат Гэксп 
Между группами . . . 134,45 3 44,52 
Внутри групп ..... 47.72 16 2,98 15,03 
Полная (общая). . . . 182,17 19 — 


Далее находим, что Ежсп> Еооо (3; 16) =9,0 (см. табл. ІУ, д 
Приложения). 


Таким образом, P{F > Рокси! < 0,001 и пулевая гипотеза отвер- 
гается: различия между сортами по урожайности статистически 
высоко значимы. 

Если число наблюдений в группах разное (несбалансирован- 
ный план эксперимента), то это не вносит существенных изме- 
нений в схему однофакторного дисперсионного анализа. 

Мы не будем рассматривать этот случай подробно, укажем 
лишь, что в вычислениях изменяются только два пункта: 


в 
1. Общее число наблюдений: М--У, л;. 
5. Сумма кгадратов между группами 
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где п; — объем і-й выборки. 
$ 3. МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ 


Сравнение средних значений ри, ро, ... ик нескольких (k) 
независимых нормальных распределений не ограничивается про- 
стой констатацией факта: есть различие (совокупности неод. 
нородны) или нет различия (совокупности однородны). Жела- 
тельно знать, какие конкретно из анализируемых совокупностей 
различаются своими средними значениями. Существуют разно- 
образные методы множественных сравнений для выявления та- 
ких различий. 

Мы рассмотрим следующую двушаговую процедуру, которая 
одновременно и проста, и достаточно эффективна. На первом 
этапе проводится дисперсионный анализ (модель 1), как описа- 
по в $ 1. И только после того, как на основании дисперсионного 
анализа сделан вывод о неодпородности сравниваемых совокуп- 
ностей (при заданном уровне значимости о), переходят ко BTO- 
рому этапу, на котором проводится попарное сравнение сред- 
них значений всех k совокупиостей с помощью #-критерия (при 
том же уровне значимости а). 

Вспомпим, что зпамепатсль статистики #-критерия для срав- 
нсния средиих значений двух (Е=2) независимых нормаль- 
ных распределений содержит обобщенную (средневзвешенную) 
оценку дисперсии о? вида 
м 524 9,5) 

Мрт 
(см. гл. УГ, $ 2). Естественным образом эта оценочная стати- 
стика обобщается на случай нескольких (#>2) независи- 
мых выборок и принимает вид 


2 
ss 


R -9 R —о 
ре vs; 225 №5; ЕТ 
“ғ Ў N =, р г 10» 
е 1—1] і 


т. е. равна статистике МЗ, которая в модели | дисперсиопного 
анализа называется средним квадратом внутри групп и является 
взвешенной по Е группам (выборкам) оценкой дисперсии о. 
Тогда статистика 


і Е 
а т етене РВ 2 (У), у= М — Е, із-/, 
У м5, -+> 
ni nj 
T. е. имеет #-распределение с параметром v=N—k. Очевидно, 
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то li; может служить статистикой критерия для попарного 
сравнения средних значений pi и р; (15=7) нескольких незави- 
симых нормальных распределений. Подчеркнем, что результат 
этот справедлив только для случая равенства дисперсии срав- 
пиваемых распределений 07=0;= ... =0# =0°. 

Такой критерий часто называют множественним і-критери- 
ем. Подчеркнем еще раз, что он применяется только на втором 
этапе обсуждаемой двушаговой процедуры, т. е. после того как 
дисперсионный анализ выявил неоднородность сравниваемых со- 
вокупностей. Лишь когда k=2, т. е. в случае двух независимых 
нормальных распределений, процедура сравпения является од- 
пошаговой: статистики Е-критерия и критерия {;; становятся 
идентичными (см. задачи УІ-10 и УПІ-3)! 

Обратимся вновь к примеру ІУ-15. Поскольку дисперсион- 
ный анализ выявил существенные различия между сортами (при 
0,001), встает задача множественных сравнений, т. е. задача 
проверки новой гипотезы Но: pip; 15]. Для этого вычисля- 
см значения 


lij (эксп) = V Msa Oin пир нала № — R, 
В примере ІУ-15 объемы всех выборок одинаковы (сбалансиро- 
ванный план эксперимента). В таком случае 
|т,-- т, | 
У М5, 2]п 


Находим У М5, 9и = |2,98. 0 2/5 = 1,09. Полученные зна- 
чения Ё; (ок) приведены в табл. 52. 


г, (эксп) == 


Таблица 52 


Матрица множественных сравнений для данных примера 
ГУ-15 (приведены значения Mj и 7, 


іј (эксп) 
Сорт А В С 
т, 34,42 34,78 33,70 
В 34,73 0.33 
С > 33,70 0,78 0,99 
D 28,38 5,54 5,87 488 


Согласно табл. ІП Приложения 10,005 (16) =4,02. В табл. 52 
три значения fij(əkcn) превышают данное табличное, а именно: 
lap, {вр И ср. Следовательно, только низкоурожайный сорт D 
(тр--28,38) отличается на 0,1%-ном уровне значимости от трех 
остальных сортов. 
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$ 4. ПОНЯТИЕ О МОДЕЛИ П ДИСПЕРСИОННОГО АНАЛИЗА 


Исследователя часто не интересуют сравнительные оценки 
тех конкретных уровней фактора, которые изучаются p 
определенном эксперименте. Такие ситуации очень часты в по. 
пуляционной биологии. 

Пример УШ-1. Изучалась изменчивость размеров листа 
дуба скального Quercus petraea на северо-западном Кавказе 
По маршрутному ходу со 163 деревьев брали по 5 листьев. Из. 
менчивость листьсв внутри деревьев — это метамерная изменчи. 
вость. Изменчивость листьев на разных деревьях связана с их 
генетическими различиями и различиями в условиях произра. 
стания. Таким образом, в этой схеме изучается один фактор 
(деревья), представленный k= 163 уровнями (группами) с n=5 
повторными наблюдениями. При этом нас совершенно не инте. 
ресует сравнение выборочных средних конкретных 163 де. 
ревьев. 

Исследователь рассматривает эти уровни как случайную вы- 
борку из практически бесконечного множества уровней изучае- 
мого фактора А. Его интересует, насколько общая изменчивость 
признака определяется изменчивостью данного фактора А. Дру- 
гими словами, разлагая общую дисперсию на составляющие 


2 — o? 2 
R Sa F се, 
в конечном итоге нужно узнать: 1) отличается ли о2 от нуля 


и 2) если отличается, то оценить долю (силу) влияния изучае- 
мого фактора в общей дисперсии, т. е. оценить величину 02 /02= 


— и, которая называется коэффициентом внутриклассовой Kop- 
реляции. Это модель П дисперсионного анализа, или модель со 
случайными эффектами. При этом меняется смысл исходной ли- 
нейной модели 


Хутв а + ё. 


Здесь и — общее среднее (как и в модели Г); 02; ~ (0; 62) 
(1=1, 2, ..., №) — независимые нормально распределепине слу- 
чайные величины со средними 0 и дисперсиями о; для всех i; 


ei~ № (0; 92) (= 1, 2, ..., №, ј=1, 2, ..., п)- тоже независимые 
нормально распределенные случайные величины со средними 0 


и дисперсиями о?. 
В модели предполагается также независимость случайных 


величин а; H е:,. 
Метод разложения общей дисперсии остается тем же самым, 


Вычисляются статистики 55:, 55, и 55,. В качестве оценок 
внутригрупповой и межгрупповой дисперсий используются ста- 
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„истики М5, и М5,. Проверяется гипотеза Но: 02 =0. Можно 
показать, что 


Е(М$,) =% и Е(М5,) = + lo 


? 


где 


[= №. n). 


| N аі; 1 


/ 


в случае равного числа паблюдений во всех группах яспо, что 
[=й 
Следовательно, ссли нулевая гипотеза верна, _то Е(М$ь) = 


=Е(М85,), если же гипотеза неверна, то Е(М$ь) >E (М5,). 
Тогда очевидно, что, как и в модели 1, проверка нулевой гипо- 


тезы сводится к рассмотрению отношения М5,/М5,, которое при 
справедливости Но имеет Е-распределение: 


М5,/М5, С Ғ(», Yə), У, = У} = в — 1, У» = Yy == № — К. 


Таким образом, в двух разных моделях дисперсионного анализа 
для проверки по существу одной и той же гипотезы можно ис- 


пользовать статистику М$ь/М$ и соответствующий односторон- 
ний Р-критерий. 

Если на основании этого критерия влияние фактора А при- 
знано статистически значимым, то представляет интерес оце- 
нить долю влияния изучаемого фактора. Для этого использу- 
ются оценки соответствующих дисперсий: 


2 ис — 2. 
ДЛЯ г Се, 
для в, — T (МУ, — М5, = 52, А 


Тогда доля влияния фактора А оценивается (по Р. А. Фи- 
шеру) с помощью выборочного коэффициента внутриклассовой 
(впутригрупповой) корреляции 


о 92 (524. со 

Га = 821(8 T 52). 
Эта статистика есть точечная оценка коэффициента вну- 
триклассовой корреляции рь в генеральной совокупности. И u- 
тервальная оценка (для равной или близкой численности 
групп) с доверительной вероятностью 1--о может быть найдена 
как 


/ 


Е Ғ —1/F = 


эксп “табл эксп табл 
р. 
Fo +< — 1). Е: Е Р екеп +I 102—1): Розе 


где Е = Е (№ 6; 1); Е" 


табл табл 


= В. (Е—1; № Б). 
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Пример УН!-2 [Снедекор, 1961]. Изучалась измепчивосъ 
размера тела у одной из пород свиней. От 5 свиноматок взято 
по 4 поросенка. Измеряли длину поросят по достижении ими 
90 кг (табл. 53). 

Таблица = 


Длина поросят (см), происходящих от 5 свиноматок (к примеру У1-2) 
] 1 `` 
| Средняя 
Свиноматка Длина поросят (х, ,} длина 
(i) Фе (т) 
зии» ЭЧ 


1 93,5 94,5 95,0 89,5 93,38 

2 910 99,0 96,0 93,5 95,63 

З 94,0 910 93,0 92,0 92,50 

4 88.0 88,0 7,0 90,0 88,25 

5 93,0 91,0 94,0 90,0 99 00 
Вычисляем: 


1. У-4Х5--20. 

2. G= 1847,0. 

3. С--170570,45. 

4. 55:-- 170747,00--170570,45-- 176,55. 

5. 55,--170685,38--170570,45-- 114,93. 

6. 55,,-- 176,55—114,93 = 61,62. 

7. мь=5—1==4; уу-:20--5-< 15; у;--20--І--19. 

8. MS,» = 114,93 4 --28,73. 

9. М5,--61,62/15--4,11. 

10. Рэкси==28,73/4,11 = 6,99. Ғ.қоп>/Ғо,005 (4,15) =5,8 (см. табл. 
IV, г Приложения). Таким образом, Р(Е > Еко) < 0,005, т. е. 
различия между свиноматками значимы. Поэтому имеет смысл 


ла 4,11 —4 92— 


и коэффициента внутриклассовой корреляции (доли влияния 


оценка компонент дисперсии: 52 ==4,11, 52 = 


свиноматок) ги = 95 411 = (0,54. 


Построим, наконец, 909 -ный доверительный интервал для 


ро: F в, = Ро,05 (15; 4) =5,86; Е = Еов(4; 15) = 3,06; 
609—306 2, 6,99 — 586 . 
6,99 + 3,06 х 4 Ф 6,99 4. 1 
' 586X 4 


О 20 <р, < 0,97. 


Полученный результат показателен: доверительный интервал 
ДЛЯ рь очень велик, поэтому не следует никогда полагаться 
только на точечную оценку! 
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6 5. ПОНЯТИЕ О ДВУХФАКТОРНОМ ДИСПЕРСИОННОМ АНАЛИЗЕ 


Пример VIII-3 [Снедекор, 1961]. У трех видов цитрусовых 
деревьев было определепо при трех условиях затенения отно- 
пение листовой поверхности к сухой массе листьев (табл. 54). 
Значимы ли различия по изучаемому признаку: 1) между вида- 
ми цитрусовых, 2) при разной степени затенения? 


Таблица 51 


Отношение листовой поверхности к сухой массе листьев 
у цитрусовых (к примеру УПІ-3) 


Вид 
Степень затенения 
апельсин | грейпфрут | мандарии 
На солнце... .... 112 90 123 
Частичное затенение. , 86 73 89 
В тени ........ 80 62 81 


Решение поставленной задачи требует применения двухфак- 
торного дисперсионного анализа. Один исследуемый фактор 
здесь — вид цитрусовых А, другой — условия выращивания В. 
Все три вида испытываются в одних и тех же для каждого вида 
условиях, т. е. каждому уровню одного фактора соответствует 
каждый и один и тот же уровень другого фактора. Это случай 
полной, или перекрестной, классификации. По самой постановке 
сформулированного в примере УП-3 вопроса по обоим факто- 
рам следует рассматривать модели с фиксированными эффек- 
тами (модель 1). Своеобразие этого примера заключается в том, 
что в каждой ячейке табл. 54 содержится только одно на- 
блюдепие. 

Двухфакторный дисперсионный анализ с единственным па- 
блюдением в ячейке (без повторностей) имеет важное приме- 
нение в планировании эксперимента. 

Пример УШ-4. В примере ІУ-15 проводилась полная paH- 
домизация четырех сортов, каждый в 5 повторностях, по делян- 
кам (см. табл. 11, рис. 34, а). Однако найти относительно одно- 
родный участок такого размера, чтобы его можно было раз- 
бить на 20 делянок, довольно трудно. Всегда будут оставаться 
сомнения, нет ли в его пределах градиента каких-то почвенных 
условий, подчас сложно установимого. Гораздо проще посту- 
пить следующим образом: разбить участок на пять блоков 
с 4 делянками (см. рис. 34,6) и проводить рандомизацию сор- 
тов в пределах каждого блока, а при анализе учесть влияние 
второго фактора — «блоки». При полной рандомизации 
сравнение столбцов одного номера (для разных сортов) в табл. 
11 смысла не имеет, это просто порядковый номер повторности. 
При выделении блоков, однако, такая процедура становится 
осмысленной: сравниваются урожаи разных сортов в пределах 
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блока. Если один фактор (сорта в нашем примере) имеет р 
уровней, а другой (блоки) — п уровней, то математические ожи. 
дания средних квадратов имеют вид 


Е(М$, = 
Е(М5,) = 02 ЕЯ "2. м — p)’; 
Е = 2° e ау ру — В)? 


и схема вычислений несколько изменяется: 
1—5. То же, что и в однофакторном анализе. 
6. Сумма квадратов между блоками 


5һ-252.%)-< 


7. vo=k— l; Уаз-П--І; vw= (8—1) (п 1); уі--А--іІ. 
8—10. То же, что и в однофакторном анализе. 
11. Сумма квадратов ошибки 
о аа ро 
12. Fren = $2 (М5... 


зксп 


Результаты двухфакторного дисперсионного анализа удобно 
представлять в виде таблицы (табл. 55). 


Таблица 55 
Таблица двухфакторного дисперсионного анализа с перекрестной 
классификацией 
Изменчивость Сумма РЫА Средний Е 
квадратов полы квадрат эксп 
2 2 ipa 

Блоки ....... SSa п--1 52 за М8, 
Сорта е е 42. °. е 55% k = | MSp М5,/М8, 
Ошибка ...... 95% (ё – 1) (п-1) М5, 
Общая я 55; --1 


Организация опыта с выделением блоков приводит в при- 
мере ҮПІ-4 к следующему анализу: 

6. 55а4--21564,51--21543,05--21,46. 

7. vo =4—l=3; \а=0—1|=4; уш=3Ж4=12; у==20— 1 = 19. 

11. 55, = 182,17—134,45—21,46 = 26,26. 

12. Еъксп==2,45. 

Таким образом, в нашем примере (табл. 56) различия между 
блоками оказались незначимыми. 

Гораздо более интересная ситуация возникает в двухфактор- 
ном дисперсионном анализе, когда в каждой ячейке мы имеем 
несколько повторных наблюдений. 
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Таблица 56 
Результаты дисперсионного анализа для данных примера УП!-4 


ее БЕ ЗЫ ИТ зы тии ОНИ ны a 22 


Сумма о. Средний ма 
шаа квадратов свободи квадрат Faken P {F> Foken} 
И ON A T 
BIOKH > + e e e e + | 21,46 4 5,36 2,45 >0,05 
Сорта ее... 134,45 3 44,82 20,47 <0,01 
Ошибка........ 26,26 12 9,19 ЕЕ БА 
Общая е + | 182,:7 19 == = я 


Пример VIII-5 [Гласс, Стэнли, 1976]. Изучалась зффектив- 
ность двух различных методов (А) и двух различных условий 
(В) обучения геометрии. 

48 школьных классов были случайно разделены на 4 груп- 
пы, так что для каждой группы из 12 классов применялся один 
из методов обучения в одном из условий. В конце полугодия ис- 
следователь провел одну и ту же контрольную работу по гео- 
метрии в каждом классе. Каждый класс был охарактеризован 
по некоторому критерию успеваемости (табл. 57), баллы округ- 
лены до целых. 

Таблица 57 


Исследование эффективности разных методов и условий преподавания 


геометрии 
Условия (В) 
Метод (А) 

лекция в классе программированнос обу чение 
Традиционный 2 4 4 9 10 10 
5 6 6 12 13 13 
6 7 7 14 14 14 
7 8 10 15 16 17 
Современный 10 10 11 21 22 22 

13 13 19 25 26 о 
14 14 15 9 32 32 
16 17 17 33 34 35 


В этом случае оказывается возможным оценить влияние не 
только главных эффектов А и В, но и их взаимодействия АВ. 
Наличие взаимодействия означает, что эффекты разных факто- 
ров не просто суммируются, но при некоторых комбинациях 
уровней факторов оказываются больше (или меньше) аддитив- 
пых. Поясним это упрощенным примером. Пусть лечебный эф- 
фект сульфамидного препарата равен З, а антибиотика — 5. 
Аддитивный эффект (отсутствие взаимодействия) заключается в 
том, что при совместном применении сульфамидного препарата 
и антибиотика лечебный эффект будет равен 3--5=8. Взаимо- 
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действие же (положительное) может выразиться, например, в 
мультипликативной реакции: 3x5=15. 
Возможность обнаружения взаимодействий является принци. 
пиальным достижением, полученным Р. А. Фишером. 
Статистическая модель двухфакторного комплекса с повтор. 
ностями выглядит следующим образом: 


Xir Te - P; + (48), + Eije 
где и — общее среднее; о; — отклонения от u, обусловленные 
действием фактора А; В; — отклонения от и, обусловленные дей. 
ствием фактора В; (ер): — отклонения от аддитивного эффекта 


(взаимодействие); eij ~ № (0; 92) — «ошибки», независимые слу. 
чайные величины, распределенные нормально со средним 0и 
дисперсией 62. 

И вновь очень важными являются предположения: 


Е үй 
да 0; == 0; 2 (aB); =: 0 для всех i 


| 
и >. =0; Ы, (а у--0 для всех j. 


Двухфакторные комплексы с повторностями могут быть трех 
типов: 1) равномерные (с равным числом наблюдепий в каждой 
ячейке), 2) пропорциональные и 3) непропорциональные (с про- 
извольным, разным числом наблюдений в ячейке). Пример про- 
порционального комплекса показан в табл. 58. Пропорциональ- 


Таблица 58 
Пропорциональный комплекс двухфакторного дисперсионного анализа 
В о 
Факторы |уровни ) і | ( Ж бај 
і 
1 | пъ-+2 | nis 4 | пу =6 
А 2 | по: = | Поо = 6 | по ==9 
З | Пҙі = 2 | Пзо = 4 | пз == 6 
у 7 14 21 
За пу n = П о = пЕ-- 


ным называется такой комплекс, для численности любой ячей- 
ки которого выполняется условие 
п.п.) 


аа J 
Nij = n . 


И теоретически, и технически хорошо разработаны равно- 
мерные комплексы. Ситуация несколько осложняется для про- 
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порциональных и становится совсем сложной для непропорцио- 
нальных комплексов, здесь возможно применение лишь прибли- 
жепных и весьма трудоемких с вычислительной точки зрения ме- 
тодов. Поэтому всегда следует стремиться при планировании 
эксперимента к равномерному или в крайнем случае к пропор- 
циональному комплексу. Более того, если комплекс оказывается 
все-таки непропорциональным, выгоднее исключить (случайным 
образом) часть наблюдений (5--10%), чем вести его полный 
апализ. 

Если оба фактора имеют фиксированные уровни, то это бу- 
дет модель І двухфакторного анализа; если уровни обоих фак- 
торов случайные, то речь идет о модели П. Возможен и третий 
вариант: уровпи одного фактора фиксированные, другого — слу- 
чайные; это смешанная модель. 

До сих пор мы говорили о схеме полной классификации. 
Очень часто, однако, приходится иметь дело с иерархической 
классификацией. 

Пример УШ-6. В примере УП-2 была приведена часть ма- 
териалов более обширного эксперимента. В действительности 3 
хряка скрещивались каждый с 5 свиноматками, причем ни один 
хряк не скрещивался с одной и той же свиноматкой и в потом- 
стве каждой матки отдельно учитывались признаки четырех по- 
росят. Таким образом, дисперсионный комплекс был двухфак- 
торным иерархическим, его структура представлена на рис. 46. 


Хряки 1 2 3 


Свиномати 1 2? 3 4 5 12 3 45 12 5 4 5 


Поросята Жос прав кор ви рио, а 
Фиг © 2? Із ea осле а. АЛАДЫ, 

зы За азы ЛЫН ы қол E 

< Физ Tiy | пш лы а ты стай 


Рис. 46. Схема двухфакторной иерархической классификации (к при- 
меру VIII-6). 


$ 6. НЕСОГЛАСОВАННОСТЬ С МОДЕЛЬЮ ДИСПЕРСИОННОГО 
АНАЛИЗА И ПРЕОБРАЗОВАНИЕ ДАННЫХ 


Напомним, что в модели однофакторного дисперсионного 
анализа с фиксировапными эффектами делаются следующие 
предположения: 
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м ~ 
І.Хцт-р-Ко4--64; причем ХЕ ai= 0. «Нелинейность» зксперц. 
ментальной ситуации может заключаться, например, в том, что 
эффект данного уровня неодинаков для всех изучаемых объек- 
тов, т. е., другими словами, имеет место внутригрупповая Гете. 


рогенность. 


2. е;; — независимые нормально распределенные случайные 
величины с одной и той же дисперсией o?. Нарушение условия 
независимости может возникать, в частности, при проведении 
повторных наблюдений над одними и теми же объектами. Закон 
распределения, например нормальность, является, как правило, 
свойством признака. Нередки ситуации, когда определенный 
уровень фактора влияет не только на групповую среднюю, но и 
па дисперсию, и тогда условие равенства дисперсий во всех 
группах будет нарушаться. 

Существует ряд методов, с помощью которых можно прове- 
рить, выполняются ли требования модели в конкретном материа- 
ле, подлежащем изучению с помощью дисперсиоппого анализа, 

Поскольку вопрос о границах применимости дисперсионного 
анализа очень важен, отметим, что этот вопрос неоднократно 
нзучался и продолжает интенсивно изучаться специалистами по 
математической статистике. Правда, исследовапие осуществля- 
ется, как правило, не аналитически (на пеобходимом уровне 
строгости), а вследствие чрезвычайной сложности возникающих 
задач, путем проведепия статистических экспериментов, часто с 
использовапием электронно-вычислительных машин. 

Если попытаться совсем кратко (и огрубленно) суммировать 
имеющиеся на сегодняшний день результаты, то можно сказать 
следующее. Аппарат дисперсионного анализа вполне применим, 
если распределение куполообразно и пе резко асимметрично, а 
групповые дисперсии различаются в 1,5—2,5 раза. По-видимому, 
допустимы и значительно большие отклонения, но при усло- 
вии равенства числа наблюдений в группах в однофакторном 
анализе и равномерности двухфакторного комплекса. 

Нередко еще до начала эксперимента у биолога могут быть 
соображения о виде распределения изучаемого признака. И если, 
папример, предполагаются биномиальное или пуассоновское 
распределения, для которых среднее и дисперсия связаны, то, 
конечно, не следует надеяться на устойчивость модели диспер- 
сионного анализа. В этих и аналогичных случаях надо заранее 
предусмотреть и осуществить преобразование шкалы измерений, 
которое дает распределение, по крайней мере близкое к нор- 
мальному, и стабилизирует дисперсию. 

В случае распределения Пуассона обычно используется пре- 
образование үх или, для малых значений х, преобразование 


үх--с, где оптимальным является с--0,386. 
В случае биномиального распределения обычпо берется 
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д arc біпүй, где h — частота события (дисперсия стабилизируется 
для значений h от 0,05 до 0,95). 

Для асимметричных, вытянутых вправо распределений, ча- 
сто встречающихся особенно в физиологии, целесообразно пре- 
образование 16 x. 

Вообще говоря, если экспериментатор проводит обширные 
опыты на протяжении достаточно длительного времени, рабо- 
тая с какими-то определенными признаками, всегда полезно не 
ограничиваться вычислением статистических оценок параметров, 
но попытаться построить соответствующее распределение и ис- 
следовать его более подробно. 


6 7. СРАВНЕНИЕ ПАРАМЕТРОВ ПОЛОЖЕНИЯ НЕСКОЛЬКИХ 
НЕИЗВЕСТНЫХ РАСПРЕДЕЛЕНИЙ 


Для сравнения параметров положения нескольких генераль- 
ных совокупностей, имеющих неизвестное распределение, пред- 
ложено несколько непараметрических критериев. Здесь мы рас- 
смотрим один из них — критерий Қрускала--Уоллиса, эффектив- 
ность которого сравнима с эффективностью Е-критерия. 

Подобно тому, как Е-критерий в однофакторном дисперси- 
опном анализе является обобщением двухвыборочного {-крите- 
рия, критерий Қрускала--Уоллиса есть обобщение критерия 
Вилкоксона — Манна — Уитни на случай сравнения параметров 
положения нескольких совокупностей с неизвестными распреде- 
лениями. 

Пусть (Xii, ..., Хаа), (Ха... Хол), eae (Хы,... Хол) — HE- 
зависимые выборки из совокупностей, каждая из которых име- 
ет непрерывную функцию распределения Ё; (х), і==1, ..., k. 
Проверяется гипотеза Но: т == ... << тв<<т о равенстве парамет- 
ров положения этих А совокупностей. Альтернатива Hi: т; т 
подразумевает, что по крайней мере одна из совокупностей от- 
личается от всех других параметром положения. Ситуация, за 
исключением предположений о нормальности распределений и 
о равенстве внутригрупповых дисперсий, аналогична модели | 
однофакторпого дисперсионного анализа. Поскольку распреде- 
ления сравниваемых совокупностей неизвестны, гипотезу Но сле- 
дует проверять с помощью непараметрического критерия. 

В качестве меры различия параметров положения в критерии 


Крускала—Уоллиса по существу выступает статистика И Ман- 
га — Уитни. Проиллюстрируем это примером. 

Пример ҮШІ-7 (М. В. Падкина, 1978 г.). У четырех штам. 
мов дрожжей Saccharomyces cerevisiae определяли константу 
Михаэлиса — Ментен Км (10-3 М) для кислой фосфатазы. Для 
каждого штамма проведено 3—4 повторных опыта по выделе- 
нию фермента и определению его активности. Результаты пред- 
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ставлены в табл. 59. Различаются ли штаммы по этому показа. 
телю? 
Таблица 59 
Значения Км (10-3М) для четырех штаммов дрожжей 
Saccharomyces cerevisiae (к примеру \У11-7) 


Номер штамма 


1 2 3 | 4 
2,17 2,08 1,66 1,52 
190 2 00 120 166 
2,20 2,12 ‚61 1,59 

1,92 147 


Имеем 4 независимые выборки (--4), объемы которых со. 
ответственно: пя: 3, Пә--4, пз= 3, И. ==4; общее число наблюде. 
ний М=>” ‚и; =14. Составим матрицу сравнений (табл. 60), 


Таблица 60 


Матрица сравнений к построению критерия Крускала — Уоллиса 
(см. пример У1!!-7) 


хи | 2,17 1,92 2,20 | 2,08 2,00 2,12 1,92 | 1,66 1,20 1,61 | 1,52 1,66 1,59 1,47 


+ 


+ ++ ++ + + + + 4 
1,92 -- - ++ + + рУ + ++ 
2,20 +++ + 
208| — + +++ 
20 | - + - + + + ро + 
22 = + - Е Е Е + 
192| — + - + + +|+ + + + 
ее ва в в 9 № 
ООД ә. е. жі ры ты пра ве із 2. 24 22 
111 — - -|- - - - + + + 
1,52 - -- -- = Алы) се „цака sda и е 
1,66 | — -|- - - - | + + 
1,59 | — = шан (а-ы, ыа. да ры. Дио цена 
1,47 | — р 5, е Ж раси 200, 2 
U | | | 34,5 
иг | 29,5 | 31,5 | 6,5 | 5,5 


Қаждый столбец этой матрицы представляет собой сравнение 
одной из выборок со всеми остальными. В двух нижних строках 
приведены значения U+ и Ог: 
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О =Т 4518 и Ог =T +5 ETE 


где ТЎ, Т, ТЕ-- число знаков «+», «—», «+» в гм столбце 


цатрицы соответственно. (Используя соотношение ИГ + И; = 
и (м пі), проверьте правильность вычислений). Как и в в слу- 


чае критерия Вилкоксона--Манна--Уитни, статистики ОГ и 
ГТ равноправны и мы будем использовать только одпу из 


них — Оў, обозначая ее просто (а. 
Статистика критерия Крускала — Уоллиса конструируется 
следующим образом. Построим нормированную случайную ве- 


личину 
щ = EA N (0; 1), 
V рӯ, 


распределение которой, как известно (гл. VI, $ 7), уже при ma- 
лых значениях п; хорошо аппроксимируется нормированным нор- 
мальным распределением. Ее математическое ожидание есть 
при Но 


ЕЙ, = тп (М — т). 


В качестве статистики ПО, как и в случае параметрического 
дисперсионного анализа, используется внутригрупповая диспер- 
CHA. 

Можно показать, что 


РО, = 5n (№ — 1). 


Если справедлива Но, то распределение случайной величины 
и’ при п-> со (практически при п>5) есть распределение 
(у), у= 1: 
~v —\2 
~, (0,- ЕО) А 
u? =- a E (У), y=]. 
DU; 
Статистика Қрускала--Уоллиса по существу есть сумма таких 
— АА, с- 
величин /7” — о. и? Очевидно, что только (^—1) слагаемых 


зависимы, поэтому если величину H’ усреднить по k и помно- 
жить на (#--1), то полученная величина будет примерно pac- 


пределена как y? с числом степеней свободы у=Ар— 1: 


Н' (k—1) 


H = z ~ у? (у), у--Е--І. 
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Аппроксимация удовлетворительна при объемах выборок пък 


или числе выборок k > З. Статистика Н называется статисти. 
кой Крускала — Уоллиса. После соответствующих подстановок 
опа принимает вид 


~% 


ey AEE 
Ai 0; 272272 ЕШ 


Если имеются совпадения, то вычисляется статистика Н* с по. 
правкой: 


где © — число групп совпадений; с; — число совпадающих зна. 
чений в |-й группе. 


Подставляя вместо 0, H с; наблюдаемые значения Ui и а 


получим Heca, сравнение которого со значениями ха (А—1) п 
зволяет делать выводы о справедливости гипотезы Но. Тава, 
образом, мы получили критерий Крускала--Уоллиса. 

Пример VIH-7 (продолжение). Имеем &=2, сі--2 и со-), 
поправка на совпадения А--0,0044. 


12 (5,5-- 16,5): (8,5 — 29)? (26,5 — 16,5)? 
Haa тэт a ит” и 3 + 
(345-209 _ 222 0 со 
-}- e пас 10,02 H Пу == Тоор -— 10,09. 


Критические значения (табл. У Приложения) Но05(3) =7,51 


и Ноо1(3) = 11,3. Следовательно, 0,01<Р{Н*> Ну }< 0,05, т. е 
нулевая гипотеза отклоняется на 5%-ном уровне значимости. 
Когда условия аппроксимации не выполняются, находят точ- 
ное распределение статистики Н Қрускала--Уоллиса. Оно выво- 
дится из предположения, что при На все возможные варианты 
расположения знаков «+» и «-» в матрице сравнений равнове- 
роятны, их общее число есть М/ (по! ...! пһ!), вероятность 
каждого из них равна "!...! пь!/ |. Подсчитав прямым пере: 
бором число разных значений H, можно получить распределе- 


ние статистики Н (см. табл. Х Приложения). 
Пусть в примере УП-7 сравниваются только первые три вы: 


борки. Тогда (1 =3,5, ҙ--8,5 и Из=21; ЕЙ =EU;=10,5 и 


Е0=Е0,= 19; Нъсп= 6,12. Согласно табл. X Приложения 
Ноов(3; 3; 4) =5,73 и Ноо (3; 3; 4) =6,75. Следовательно, 0,01< 


<Р{Н = Нол) < 0,05. 
Только после того, как критерий Қрускала--Уоллиса выявил 
неоднородность сравниваемых совокупностей в целом, можно 
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ерейти к следующему этапу статистического анализа — мпоже- 
ственным сравнениям. Для этого все Е выборок сравниваем по- 
apno с помощью критерия Вилкоксона—Манна— Уитни. 
Пример УШІ-7 (окончание). Экспериментальные значепия 
Ин експ) Статистики Манна — Уитни, получешые при попарном 
сравнении четырех штаммов дрожжей, приведены в табл. 61. 


Таблица 61 


Матрица множественных сравнений для данных примера 
УШІ-7 (приведены значения U; 


j (эксп) 
H 
2 35 
3 0 0 
4 0 0 5,5 


Объемы первой и третьей выборок слишком малы, чтобы го- 
ворить о существенности значений Оз =0, Оџ=0 и Оз 0. 
Только значение (/4--0, которое равно критическому (0,095 (4,4) 
(см. табл. VIII Приложения), свидетельствует о различиях меж: 
ду параметрами положения второй и четвертой совокупностей. 

Итак, при уровне значимости о = 0,05 кислые фосфатазы BTO- 
рого и четвертого штаммов дрожжей существенно различаются 
по сродству к субстрату (по Км). 


Задачи 


ҮНІ-1. Изучали процент гемоглобина у кур разных пород (табл. 62). 


Таблица 62 


Процент гемоглобина у кур разных пород (к задаче У111-1) 


Порода Процент гемоглобина 
Итальянские ..... 87 92 86 91 90 93 
Куропатчатые ..... 91 90 88 89 
Минорки ....... 85 82 85 80 
Бентамки ....... 82 82 85 83 81 


Одинаков ли этот показатель у разных пород? 
Какую модель дисперсионного анализа вы выберете: модель | или мо- 
дель 11? В задаче речь идет о «проценте», следует ли пользоваться преобра- 


зованием 2 агсзшИ h? Проводя дисперсионный анализ полных данных, TO- 
пробуйте выровнять число наблюдений, отбросив по таблице случайных чи- 
сел два наблюдения в первой и одно в четвертой группах. 

УПІ-2 [Bliss, 1967]. Определялась концентрация билирубина в сыворотке 
крови восьми здоровых мужчин. Предварительный анализ показал, что дис- 
персии признака внутри групп выравниваются, если использовать преобразо- 
вание lgx. Поэтому в табл. 63 приведены уже преобразованные значения. 
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Достовериы ли и насколько велики в общей изменчивости различия меж 


Д 
разными людьми по содержанию билирубина? у 


Таблица 63 


Концентрация билирубина в сыворотке крови (10-! мг/мл) 
(к задаче У1Ш-2) 


ОСП Е ЗОО ТОНИ ИБ ЕАО ЗБ ИП ТБ ЗО - 


Индивид 
д 
атр Ра 
0,36 0,43 0,61 099 | 0,79 0,72 0,92 1,18 
0,15 0,53 0,61 0,83 <] `0,91 0,83 1.18 1,11 
0,61 0,6! 0,82 0,83 0,83 0,74 0,98 0.68 
0,43 0,53 0,51 0,83 0.83 10: 1,16 0.98 
0,43 0,96 (,74 0,79 0,88 0,88 0,95 0,83 
0,74 0,85 0,19 0,88 1,01 0,91 0,98 ІШ 
0,53 0,74 0,96 1,00 0,92 1,06 1,04 1,09 
0,82 0,51 0,74 0,5 0,87 0,91 1,04 ІІ 


УШ-3. Покажите, что в случае двух выборок (Е--2) статистика Р-кри- 
терия для дисперсионного анализа идентична статистике #-критерия (ср. за. 
дачу УІ-10). 

VIII-4. С четырех участков почвы бъл произведен высев бактерий на 
10 чашек Петри с питательной средой, где каждая бактерия дает начало 
колонии. Число колоний, образовавшихся на каждой из чашек, представле- 
но в табл. 64. Различается ли число бактерий в почве сравниваемых участ. 
ков? Нужно ли преобразование данных и какос? 


Таблица 64 
Число колоний на чашках Петри (к задаче У!11-4) 


Число колоний на чашках 


Участок 

Види [2 |з [4 [5 [6 [т |в [9 [о 
Г | 

7 4 8110 Er 7| CE [и IIR 
2 5 10 9 4 | 7 5 и 12 | 15 
З 6 7 9110 | 15| 14 1121 12 4 7 
4 7 ? 11 10 8 8 12 жега: 
Ф 


УПТ-5 [Снедекор, 1961]. В табл. 65 приведены частоты растений сои, 
пораженных раком стебля. Проведите дисперсионный анализ этих данных. 
Каков закон распределения изучаемого признака? 


Табли. л 65 
Процент растений сои, пораженных раком стебля (к задаче МУ!!4-5) 
Сорт 
Блок 
А В С р | Е F 
1 19,3 10,1 25,2 14,0 3,3 3,1 
2 29,2 34,7 36,5 30,2 35,8 9,8 
3 1.0 14,0 23,4 7,2 1,1 1.0 
4 6,4 5,6 12,9 8,9 2,0 1,0 
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ҮПІ-6 [Снедекор, 1961]. Определялась численность четырех видов планк- 


тона в пробах (табл. 66). Проведите дисперсионный анализ 


Почему здесь необходимо и что дает преобразование lg x? 


Численность четырех видов планктона (к задаче У!!!-6) 


Таблица 


реа га 


Вид 
1 II Ш ү 
Проба | 
1 895 1520 43 300 11 0:0 
2 540 1610 22 800 8 600 
3 1029 1990 28 800 8 260 
4 470 1350 34 600 9 830 
5 428. 980 27 604 7 600 
6 620 1710 32 «00 9650 
7 760 1930 95 100 8 900 


ЭТИХ 


даниых. 


УПІ-7. Ч. Дарвин в течение многих лет экспериментировал с растения: 
мн. Результаты одного из его опытов представлены в табл. 67. По поводу 


было подвергнуто небольшое 


этих данных он писал: 


«Так как измерению 


Zea mays (молодые растения) 


Цнфры (в дюймах) расположены 


так, как они приведены 
у м-ра Дарвина 


в отдельных горшках 


Таблица 67 


в одном ряду 


Самоопы- 
ленные 


арбат ИИА ОЧЫРУ терм. АЧИ Кр САЛАГ ли ата ЛЕЛЕ АДИ НРА Е ам ЗНААТ 
Цифры (в дюймах) расположены согласно их величиие 


Пере- | Самоопы- Пере- | Самоспи- Пере- 
крестно- ленные крестно- | ленные крестио- 
опыленные олыленныс опыленные 
Столбец 1 H ІН У | yv vi 
Горшок 2341; 173|; 9331; 2031, | 294 
| 12 203); 21 20 - Ӛзі 
21 20 а 173. 23 
горшок | 22 20 23 29 221g 
1] 191); 182/5 21113 1851 2711; 
214; 185/ 194% 183 4 22 
: оршок 2211; 1851; 237); 185; 5 2151 
Ш 2038 1521; 29%, 18 214 |5 
1828 164/8 215/5 16: 8 21 
2158 15 203/8 16:! 21 
2328 167/; 18- |, 1528 203/3 
Горшок 21 18 23 18 191); 
ү 221); 126/, 2211; 18 1878 
23 154/; 21 153/; 12 
19 18 12 126), 12 


число растений от перекрестного опыления и самоопыления, то мне бъл 
чрезвычайно важно узнать, в какой степени достоверны полученные средниь 
величины. Поэтому я попросил мистера Гальтона, который имел большой 
опыт в статистических исследованиях, посмотреть некоторые из моих таблиц 
измерений». 

В ответном письме Ф. Гальтон сообщал, что он согласен с выводом 
Дарвина о превосходстве перекрестноопыленных растений над самоопылен. 
ными растениями, но что точная цифровая оценка этого превосходства пред. 
ставляется невозможной; «...трудность заключается в том, что мы не знаем 
точного закона, которому подчиняется ряд; ...паблюдения... слишком мало. 
численны.. .». 

Проведите статистический анализ результатов этого эксперимента. Про. 
комментируйте следуюшие строки из письма Ф. Гальтона: 

«Данные наблюдений в том виде, в каком я получил их, показаны в 
столбцах ІІ и Ш (см. табл. 67), где в них па первый взгляд, несом. 
ненно, нельзя усмотреть какой-либо правильности. Но как только мы распо- 
ложим их согласно их величине, так, как это сделано в столбцах IV и V, 
дело существенно изменится. Мы видим теперь, за немногими исключениями, 
что в каждом горшке наиболее высокое растение на той стороне, где Поса. 
жены перекрестноопыленные растения, превосходит наиболее высокое расте. 
ние на той стороне, где посажены самоопыленные растения, что второе по 
высоте растение превосходит соответствующее ему второе, третье превосхо- 
дит третье и т. д. Из пятнадцати случаев, приведенных в таблице, имеется 
лишь два исключения из этого правила. Мы можем поэтому с уверенностью 
утверждать, что ряд перекрестноопыленных растений всегда будет обнару- 
живать превосходство над рядом самоопыленных растений в пределах тех 
условий, при которых производился настоящий опыт».* 


« Дарвин Ч. Coy., т. 6. Перекрестное опыление и самоопыление, 
М.; JI., Изд-во АН СССР, 1950, с. 272—275. 


ГЛАВА IX 


АНАЛИЗ СТАТИСТИЧЕСКИХ СВЯЗЕЙ 


В этой главе будут рассмотрены задачи линейной регрессии, 
линейной корреляции, оценки рангового коэффициента корре- 
ляции (при ненормальности двумерного распределения), а так- 
же задача анализа таблиц сопряженности для качественных 
признаков, по сути являющаяся корреляционной задачей. 


$ 1. МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ 


Вспомним пример ІУ-18. В этом примере в отличие от ранее 
рассмотренных мы имеем две переменные: независимую, или 
свободную (доза облучения), переменную х и зависимую, или 


связанную, переменную y (частота мутаций). При этом важно, 
что х есть величина неслучайная, ее значения регистрируются 


(фиксируются) точно, без ошибок, а у является случайной вс- 
личиной. Нас прежде всего интересует установление функцио- 


нальной зависимости у от х вида у=}(х), наглядно показанной 
на рис. 36. Уравнение y=f(x) называется уравнением регрессии 
у на х. 


Вообще говоря, у может зависеть от нескольких переменных: 
ха), х2),..., ХТ, т.е. ухо, х2,..., xm). Мы будем pac- 
сматривать лишь случай зависимости от одной переменной. Но 
и в этом случае вид функции f(x) может быть любым и в о6- 
щем случае описываться полиномом 


Е п ; 
у= (ова аха... Ба, х" = №, ахі. 
Мы будем рассматривать лишь линейную регрессию 
у= х + Вх. 


Не слишком ли узким является круг обсуждаемых вопросов? 
Нет. Во-первых, зависимости, близкие к линейным, нередко 
встречаются в биологии. Во-вторых, преобразуя масштабы по 
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осям координат, многие типы зависимости можно достаточно 
точно свести к линейным (см. 6 4, табл. 69 и рис. 52). 

В последнем уравнении пара- 
метр В называют коэффициентом 
линейной регрессии; х — свобод- 
ным членом. При х=0 у= х, т.е. 
х — значение у в точке пересече- 
ния линии регрессии с осью ор- 
динат. При х=0 В = ш/х, т. е. к | 
В — тангенс угла наклона линии и. | £ 
регрессии к оси абсцисс (рис. 47). g 

Мы будем пользоваться B р 

а я 6 ис. 47. Геометрическая интер- 
дальнейшем и другой формой за- претация параметров хи в 


писи уравнения линейной регрес- уравнении линейной регрессин. 
CHH: 


у=хо+ В(х—т,.), 


1 А 
где Тұ--- Ў! х; и п — число наблюдений. Тогда у= (хо—Вт„) + 


Вх и x = х— Вт». Этот вид записи оказывается удобным, TO- 
скольку можно получить пезависимые статистические оценки 
коэффициента регрессии и свободного члена. 

В дальнейшем греческими буквами х и В будем обозначать 
параметры генеральной совокупности (константы), а латински- 
миаи b — выборочные оценки этих параметров. 

Пусть х — неслучайная (фиксированная) переменная, зна- 
‚чения которой хі, х2, ..., Xn точно, без ошибки, задаются (или 
известны). Значениям Х; соот- 
ветствуют значения случайных 


величин Yi, независимых и HOD- 
мально распределенных с па- 
раметрами и, и 02. Будем 
предполагать, что для любого 
ц и х имеет место линейная 


l 
| 
i 
| | зависимость 
І | 
| | | ц--х-Ерх--хо--р(Х--ты). 
| | 
И ЕЕ: РАН Таким образом, дисперсии 
1 T? T а 
" Ру; предполагаются равны- 
Рис. 48. Модель линейной регрессии. ми, а u; лежат на прямой 
(рис. 48). 


Итак, статистическая задача заключается прежде всего в 
том, чтобы оценить параметры хо, В и 0°, т. е. необходимо подо- 
брать прямую регрессии и по х: 

А 

у=а,+0 (х—т..), 
наилучшим образом описывающую (оценивающую) зависимость 
у от Х в генеральной совокупности. 
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$2. ОЦЕНКА ПАРАМЕТРОВ МОДЕЛИ ЛИНЕЙНОЙ 
РЕГРЕССИИ 


Для оценки параметров линии регрессии используется ме- 
тод наименьших квадратов, который по существу совпадает с 
методом максимального правдоподобия в случае нормально рас- 
пределенных наблюдений (см. гл. У, 6 1). Поэтому статистики, 
получаемые методом наименьших квадратов, оказываются не- 
смещенными и эффективными. Суть метода заключается в мини- 
мизации сумм квадратов отклонений наблюдаемых значений и; 

AN 


OT гипотетических (теоретических) И: 
== МТ жас ча Ж SEEE SE 
R = Ñ (yi — y.) р (Y= ар (ез пе : 


Чтобы найти Qo и b, продифференцируем R по ад и по b, npu- 
равняв производные пулю: 


оу" Ро 
стел м о 

ер ал ) P 
PA а [ y; а — b (xi — т,) | (x; — т.) = 0. 


Отсюда имеем 
D aJ — па, — 6 раи (х; — т.) = 0; 
Хала-т)-а (х т,) — b (т. 0. 
Так как У” (х; т,) = 0, то а= Е У; = ту, тогда 
=m, + öm, Коэффициент линейной регрессии равен 
МУ 10а- тд» 


2 (х; — ту) 


B последнем выражении числитель можно видоизменить: 


р = 


n Ч п 
БЗ (х, из My) У; = Ва Xi — т,)у; = т, я (xi = т.) - 
п 
- а (x; даа ту) (У; БЕ т,). 


Таким образом, статистиками для оценивания хо, хи В явля- 
ются 


Яо 549 ту, 
а =т,— bm, 


> (х= то (у: — т) 
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Обычно в биологических задачах представляет интерес ста. 
тистический анализ коэффициента линейной регрессии. Коэффи. 
циент линейной регрессии В — это константа, которая оценива. 
ется с помощью статистики, являющейся случайной величиной 
Поэтому выборочный коэффициент b есть реализация случай. 


ной величины 6, закон и параметры распределения которой тре. 
буется найти. 


Поскольку b есть линейная комбинация нормально распреде. 
ленных величин, то она распределена нормально со средним 


значением Еб = В (проверьте это утверждение!), так как метод 
наименьших квадратов дает несмещенные оценки. Найдем дис. 


персию Db, вспомпив, что Ву; = 02: 
бы 5 
рў D а (x; — ту) у: 


п 5 
“di (xi = тұ)” 


Ра тру т +. + Сат ту 
Уа (х; — т: | 
с? У!" (x; — тұ): с? 


і-е1 


n ae тт n г. 
Dai (x; — mx)? | арт (д - ту! 


Найдем теперь статистику для оценивания 0°. 
Выборочное значение 52 (оценка 02) связано с рассеянием 
AN 


полученных в эксперименте значений Yi вокруг значений /;, ле- 


AN 
жащих на линии регрессии y= 4 + b (х—т,), параметры которой 
были оценены по методу наименьших квадратов. Поэтому ста- 
тистикой для оценивания 0? является случайная величина 


ШЕ 1 әш ры 7% 
2 а Бен 2 
5 = АНИ (У, У). 


Число степеней свободы здесь -- 
меньше числа наблюдений на 
два, так как при вычислении ли- 
нии регрессии на систему были 
наложены два линейных ограни- 
чения: 


ОКИ (У: — У) -- 0; 
ама (х; = т.) -- 0. 


Как удобно вычислять значе- Рис. 49. Из чего слагается откло- 
үл 754 нение (уі-ту)? 
ние 2. (Yı = Yı) по экспери- 
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ментальным данным? Обратимся к рис. 49. Здесь показаны ли- 
AN 

ния регрессии y= 2, +b(x— тх), проходящая через точки 
AN 


(Mx, ao) и (xi, Yi), и значение (х;, yi), наблюдаемое в экспери- 
менте. Можно видеть, что отклонение точки (Xi, Yi) от среднего 
арифметического ту состоит из двух частей: отклонения у: от 


значения Yi, лежащего на линии регрессии, и отклонения ý; OT 
среднего ту = йо. асраи тождество 


У, да т, = (Yi Eg У.) + (У —т,). 
Возведем в квадрат обе его части: 
(yı ту) = [ (у у) + (y ту). 
Суммируя по г, получим 


ее 
Ут, = ХУ (У Ут, 

так как сумма попарных произведений равна нулю (см. гл. 

ҮШ, 61). 


Сумма квадратов, обусловленная регрессией, может быть 
найдена как 


— 


n | 
= (х; — ту)! 


Таким образом, интересующее нас рассеяние эксперименталь- 
ных точек вокруг линии регрессии («ошибка»), называемое сум- 
мой квадратов остатков, или остатком, вычисляется как 


n ~ ~ 12 
n ~ т” п ~ ~ 2. (xi 7% тх) (5; ЕС ту) 
У У р ат 
і ішш > (xi === My)? 


Б i=l 
и статистика S? для оценивания о? принимает вид 


ме (xi — ту) (= ту) | 


1 п ,- = 
ре 2 
== . — т.) — 
п-2 2. O: X > (x; — ту)? 


i=l 


Тогда статистикой для оценивания дисперсии Db выборочного 
коэффициента линейной регрессии b является, очевидно, 


«| 
< ко 
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Величина ѕь называется стандартной ошибкой выборочного ко 


эффициента линейной регрессии 6. 
Для практических расчетов удобны формулы 


5 му; — | 2 Xi > У; 


е п 
дз хі- т >». я} 
2 У L > 5. 2 Yı 
р а xi — - рум хі) | 


р. із” TS а) 


(см. $ 1 гл. Il, задачи 11-3 и ІХ-6). 
Пример 1Х-1 [Рокицкий, 1973]. Фактическая урожайность 


культур на одной ферме в последовательные годы была следу. 
ющей (ц/га): 


1 


РОД а а. ыла 1953 1954 1955 1956 1957 1958 1959 
Урожайность... 7,8 7,7 8,5 10,0 8,4 11,3 10,5 


Значимо ли увеличение урожайности? 
Число наблюдений п = 7. Кодируя годы через —3, —2 


= 


зе 4) 


+3, получаем Х.,%--0, т, =0; О) у, = 64,2, т, 917 
> а 2: 28; У, ‚ У = 600,88; 2a x;y, = 15,2. Тогда 


m 


2. (х; ха т)“ = 28; 
2. (У;- ту} = 600,88 — > X 6422 = 19,07; 


7 
ш/а) у 2a (х-- т,) (y: == т.) = 15,2. 
` Далее получаем b = 15,2/28 = 
= 0,543; а = 9,17. Уравнение ли: 
нейной регрессии /--9,17--0,543; 
(в конкретных примерах обычно 
пишут для упрощения у вместо 
у). Оценка 0? равна s= 
= 1/5 (12,07 — 15,2/28) = 2,305, 

223 РІ 

- оценка Db равна 5? = 2,305/28 = 
3 ба 195 06 97 6 9200 _ 008926 ка манына 
Рис. 50. Результат регрессһонного эффициента линейной регрессий 
анализа для данных примера 1Х-1. $5 = 0,288. 
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Представление исходных данных и результата их анализа па 
одном графике позволяет наглядно убедиться, насколько они: CO- 
гласуются друг с другом (рис. 50). В данном примере разброс 
экспериментальных точек вокруг линии регрессии достаточно ве- 
1ик и найденное уравнение регрессии отражает, по-видимому, 
лишь общую тенденцию к возрастанию в сложной картипе изме- 
нения урожайности по годам. 


6 3. ПРОВЕРКА ГИПОТЕЗЫ О ЗНАЧЕНИИ КОЭФФИЦИЕНТА 
ЛИНЕЙНОЙ РЕГРЕССИИ 


После того как получено уравнение линейной регрессии 


^ 
уи—=а-+6х и вычислена оценка дисперсии коэффициента регрес- 
сии 5;, возникает задача сравнения b с некоторым гипотетиче- 


ским значением В. Чаще всего, когда просто требуется ответить 
на вопрос о достоверности применяемого воздействия, проверя- 
ется Но: В=0. Или, другими словами, достоверно ли угол на- 
клона линии регрессии отличается от нуля? (Заметим, что Но: 
һ--0 не единственная возможная гипотеза, CM., например, за- 
дачу ІХ-7.) 

Решение задачи оказывается простым. Точно так же, как в 
гл. У было показано, что 


— 


т – - |А 
5/Уп 


мо жно показать, что 


~t (y), у= п — 1, 


В Ы, у= 9. 


58% 


Поэтому, вычислив 
19-9%1 L 


въксп == —_ Sp 


остается сравнить полученное значение еп С табличным 1,9 (V), 
v=n—2 (см. табл. ПІ Приложения). 
Вернемся к примеру [Х-1: 


кс == 0,543/0,228 == 1,89, у=5, 
что дает 0,05<Р{| |1} < 0,10, т. е. увеличение урожая от ro- 
да к году значимо лишь на 10%-ном уровне значимости. 


6 4. СРАВНЕНИЕ ДВУХ КОЭФФИЦИЕНТОВ ЛИНЕЙНОЙ 
РЕГРЕССИИ В, И В, 


Пример 1Х-2 [Фишер, 1958]. В табл. 68 приведены деся- 
тичные логарифмы объемов, занимаемых по мере роста клет- 
ками морской водоросли. Над культурой А наблюдения Be- 
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Таблица 68 
Рост двух культур морской водоросли * (к примеру ІХ-2) 


Культура 
Дни учета 

1 3,59 3,54 
2 3,82 3,83 
З 4,17 4,35 
4 4,53 4,83 
5 4,96 4,91 
6 5,16 5,30 
7 5,50 5,57 
8 5,60 6,04 
9 6,09 


* У — объем, занимаемый клетками. 


лись девять дней, над культурой В — восемь дней. Различа- 
ются ли кривые роста достоверно? Построив график, убеждаем- 
ся, что в принятой шкале измерений в обоих случаях зависи. 
мость lg У от x близка к линейной. 

Таким образом, мы пришли к сравнению двух коэффициен- 
тов линейной регрессии В; и Во, когда о? неизвестна. Эта 
задача ничем не отличается от задачи сравнения двух средних 
ш И рә нормально распределенных совокупностей (см. гл. V). 


Если 02-- сто, то вычисляем 


SNTE, 2252,2 ИНН 
и “ИЕ 7 
ы у: Ж. (ха — та) +. 2 (ха: — т,)- 


При v=n; по--4, где 
„ (m—2)si + (п, — 2) 5) 
3 а п! +- по — 4 


Ё ксп = 


Если o? + о2, то, как и при сравнении выборочных средних, 
вычисляют 52 и 55, а затем 


Гэкеп — 


при у, определенном из 


1 е 4-4 -- с)? 
У o y 40” 
где 
2 
$5, 
= 2 
$5, + $5, 
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Дадим решение примера 1Х-2. 
Культура, А: п, =9; кодируя дни та —4, --3,..., +4, 
10 лучаем У Хи == 0; ща? == 0: Ух 1 Хү; = = 60; У. ‚ Ун = 43, 49: 


ту, = 4,824, У, 155, = 214,8884; У? к Уи = 18,63. Тогда 


и 9 
Ў. (X11 тх)! = 60; За (Уи-ту,)%--5.4496; Ва (Хи- та) х 
у (ун — тъ) = 18,63. Малее получаем b, =0,3105; а: = 4,82. 


ее регрессии: VO = 4,82 + 0,311х. Оценка дисперсии 
с? равна s? = 0,0479. 


о Він; >. ща ак ту, =— 0, 5; 2 У. х2 = 44; 


У У. =38, 41; ааа pa ‚ y2; = 189,1565; У Хор Yai = 
8 
і= 1 


ЕЕ Тогда 5 -1 (Xa — т.) == 42; раз (У, — ту)? = 5,1436: 
МЕ (хы „(уз — Т,,) = 14,565. Далее получаем 6,=0,3468; 


а = 4,970. кедені регрессии УФ = 4,97 + 0,347х. Оценка 
дисперсии о2 равна s? = 0,0154. 


Сравнение выборочных дисперсий дает Faren == 52/52 = 3,10 


и согласно табл. 1У и P{F > Ежа | > 0,1, т.е. npu- 


нимается гипотеза Ну: 92 == 92 = o°, Поэтому 


2—7. 0,0479 + 6. 0,0154/13 = 0,0329; 


0,311 — 0,34 
Е еек Іт y oea 13; 
y 0.0329 (1605-1142) 


P {# > ве} > 0,05. 


Таким образом, кривые роста 
культур А и В не различаются. 
Результаты анализа наглядно 
представлены на рис. 51. 

В примере ІХ-2 линейная 
зависимость от времени роста 
культуры наблюдалась не для 
регистрируемого признака — 
объема, занятого культурой, 
а для логарифма объема. Очень 
часто нелинейные зависимости, 
подчас достаточно сложные, 
могут быть линеаризованы 
простыми преобразованиями. 

Некоторые типы таких пре- 
образований представлены в 
табл. 69. На рис. 52 показано, 
как выглядят исходные кривые. 


Ѓъксп == 


Ви] у 


Рис. 51. Результаты регрессионного 
анализа для данных примера ІХ-2. 


1 — линия регрессии для культуры А; 
2 — то же для культуры В. 
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9 8=-2 83 8=2 а У48-10 вее Ве? 6 


уа: 


0 г 0 т 0 


2 


Рис. 52. Вид функций, методы линеаризации которых указаны в табл. 69. 


Таблица 69 
Преобразования, используемые для линеаризации некоторых функций 


Вид функции Прямоугольные координаты * 


рис. 52 формула | абсцисса ордината 
а y = ах? log x log y 
=? х" y 
b = З хз у 
b = 112 ух y 
TAA 
b = 113 кл у 


Продолжение таблицы 69 


Вид функини Прямоугольные координаты* 
НИЕ 
рис. 52 формула абсцисса ордината 
b = —1 Их y 
b = — 2 Их? У 
2 у = аб“ х Іор у 
У = а1ор х log х у 
в у = аедхс хе log у 
1 
2 [у= аъ ы Пу 
х / 
д [у= вх Ы ху 
е у-ва + bx + сх? х (У — уо)Дх — Хо) 
Хх 
ж Y= и bx 4 со? х-- Xo е (x — хо)КУ — Уо) 
1 
3 Y= pr x log ((а/у) - 1] 


* (хо, уо) — координаты произвольной точки на эмпирической кривой. 


В связи с этим необходимо сделать два замечания. Во-первых, 
удовлетворительные результаты могут быть получены путем 
применения к одним и тем же исходным данным разных пре- 
образований. Поэтому при выборе вида преобразования сле- 
дует использовать все возможные сведения о предполагаемом 
виде зависимости. Во-вторых, в отношении преобразованных 
величин должны выполняться все условия модели, обсуждав- 
шиеся ранее (см. $ 1). 


$ 5. СОПОСТАВЛЕНИЕ РЕГРЕССИОННОЙ И КОРРЕЛЯЦИОННОИ 
ЗАДАЧ 


Пример 1Х-3. Оценим связь между массой жабр (xı) и Mac- 
сой тела (x2) у краба Pachygrapsus crassipes по данным при- 
мера 1\-17. 

Это типичный пример корреляционной задачи: у одного 
объекта регистрируются значения двух количественных при- 
знаков и стави? ся вопрос о наличии связи между значениями 
признаков в генеральной совокупности. 

Модель линейной корреляции между двумя признаками 
основана на двумерном нормальном распределении, причем 
коэффициент корреляции р является одним из параметров это- 
го распределения (см. гл. ПІ, $ 6). Подчеркнем, что вычис- 
ление выборочного коэффициента корреляции по формулам, 
которые мы ниже получим, возможно для любого распределе- 
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ния, но статистические оценки и выводы, осно. 
ванные на этом, справедливы только в предположении дзумер. 
ного нормального распределения. 

Сопоставление примеров |Х-| н [Х-3 ясно показывает раз. 
личия между регрессионной и корреляционной задачами. В рег. 


ресспонной задаче только одна из двух величин (Y) является 


случайной, в корреляционной задаче обе величины (Xi и хо) — 
случайные. 

В формальном (математическом) отношении регресспи и 
корреляция тесно связаны между собой. Мы не будем обсуж. 
дать эти вопросы, фиксируя внимание на принципиаль. 
ных (особенно в биологических приложениях) различиях в 
структуре моделей регрессионпого и корреляционного 
анализа. 


$6. ОЦЕНКА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ р 


Найдем оценки Mı, то, 52, S} и г параметров ш, |ә, 67, 22 


9 
H двумерного HO MaNBHOPO асп зеделения ПО дашии М ДВ 
p y: 


мерной выборки (хи, ха), (Хо, хәз), (Xin, Xan) С по- 
мошью метода максимального правдоподобия. Будем, как и 
раньше, искать максимум логарифма функции правдоподобия: 


іл L (ti, г, 91, бо, p) = — Ң In (то, 9, Ит1-2) --- 
| D (хи- м): 5 И. (Хур 81) (Хор - мо) 


РИШЕ OAA ранет же. 2 A ао т. 2р —— и 
2—6’) с} 2192 
п о 
де (х9: — шо)? 
+ 
99 


Дифференцируя іп L по ui, нә, бі, 02 и р, приравнивая производ 
ные нулю, подставляя, наконец, вместо значений параметров 
их оценки Mı, Mə, $1, S2 и г, читатель может получить в pe- 
зультате решения уравнений правдоподобия следующие ста- 
тистики для оценки всех пяти параметров двумерного нормаль- 
ного распределения: 


Ба У" таза Ў), ха 
52 Хы, (х-ті); У. (хо, тъ); 
= Од ЕД — mı) (Xa — т.) 
V Xi Gu — m)? Ур ота | 
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— 


Величина г, служащая точечной оценкой параметра р дву- 
мерного нормального распределения, называется выборочным 


коэффициентом линейной корреляции, или коэффициентом кор- 
реляции Пирсона. 


Удобной для въчисления значений г является формула 
За Хи Хор — L Dri Xii DE Хә; 
VEA En рота 
(см. $ 2 и задачу [Х-6). 


Вернемся к примеру ІХ-3. Глазомерная оценка данных, 
представленных на рис. 35, убеждает, что зависимость между 


C 


хи Хо можно считать линейной, т. е. линеаризующее преобра- 
зование данных не требуется (ср. задачу 1Х-3). Тогда имеем 


112; У xu=2347; D; хыс 144,57; У? хі, = 583403; 

e x2, = 2204,185; Ў)", Хъху-- 34837,10. Отсюда У, (х, - 

— m,)? = 194368,917; Ў (х, — m)? = 469,478; Ў? (Xi 

— т.) (Хо; == ть) = 6561,618 H 
6561,618 


r = 1943589175452 478 


= 0,87. 


Полученное значение г=0,87 свидетельствует, по-видимому, 
о сильной положительной корреляции между массой жабр п 
массой тела у краба. 

Следующий необходимый этап анализа — установление ста- 
тистической значимости полученного результата, что сводится 
по существу к проверке гипотезы о независимости двух нор- 


мально распределенных случайных величин д; и Хо. 


$ 7. ПРОВЕРКА ГИПОТЕЗЫ О НЕЗАВИСИМОСТИ ДВУХ 
НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ 


Распределение статистики г (г-распределение) не выража- 
ется в элементарных функциях, тем не менес оно достаточно 
подробно изучено. В общем случае оно резко отличается от 
нормального и сходится к нему чрезвычайно медленно (нера- 
зумно пользоваться нормальной аппроксимацией при п<2500!). 


Можно показать, что случайная величина НИ 1- является 
комбинацией трех независимых случайных величин: u~ М(0; 1); 
E 79 7 
7? ~y? (а), үр--һ--І, Н 73 ~ X (уг), yo= Nn—2?, Sis 
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Поэтому в частном, но важном для практики случае, когда 
о = 0, имеем 


r u 


уг уа 
та тт —, 
где %?~y? (v), у--п--2. Помножив обе части на үу--үп-2 
получаем 


В таком случае можно проверить гипотезу Но: р<<0, т. е 
проверить, являются ли два нормальных распределения не. 
зависимыми (см. 6 6 гл. ПІ). Для этого требуется найти 
значение 


эксп — ИІ, 


и сравнить его с критическим значением 14/9(у), ү--П--2. 
Указанное свойство позволяет вычислить критические зна. 
чения 


а]? (У) 


------. У=И— 2, 
Ув (“)-кп--2 


Га (у) = 


такие, что Р{Г>го/2(У)} =а/2. Эти значения приведены в 
табл. ХІ Приложения. Таким образом, для проверки гипотезы 
о независимости достаточно сравнить экспериментальное зна- 
чение | гоксп| С Табличным Га/2 (у), v=n—2. 

Проверим значимость результата в примере ІХ-3. Имеем 
г 0,87, ү--192--2--10; находим 


0,877 12--2 
t = — тт = 5,58. 
зксп үт — 0872 


Согласно табл. ІП Приложения Ё, 0005(10) =4,59, следователь- 


по P{|t| = tac} < 0,001, т. е. между массой жабр и массой 
тела у краба имеется высокозначимая положительная корре- 
ЛЯЦИЯ. 


По табл. ХІ Приложения 700005(10) --0,82, следовательно, 
Р( | го <0,001, т. е. мы приходим к тому же выводу. 
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$ 8. СРАВНЕНИЕ ДВУХ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ р, И р, 


Р. А. Фишер в 1921 г. указал замечательное нормализую- 
pee п стабилизирующее дисперсию преобразование случайной 


величины г: 


которое не зависит ни от р, нн от п. Если п>50, то распреде- 


ление случайной величины 2 близко к пормальному со сред- 
ним и дисперсией: 
| 


> | + ае я 
Бг = 71а т, Н Dz = 5. 


"O 


Таким образом, пормированная случайная величина 
~ 2 — Ег 
Ц---г----- -- М (0; 1). 


Для перевода значений г в = и обратно используют таблицу 
ХИ Приложения. 

С помощью 2-преобразования можно проверять гипотезу Но: 
пра о равенстве коэффициентов корреляции двух двумер- 
ных нормальных распределений. Если эта гипотеза верна, то 
случайная величина 


И Шт — 3) + (иа - 3) 
и для проверки Но вычислеиное по выборке значение |Изнеп] 
сравнивают с иә. 

При п<50 такой критерий становится консервативным, т. е. 
малочувствительным к отклонениям от нулевой гипотезы. 
В связи с этим Г. Хотеллинг, изучая возможности улучшения 
г-преобразования, в 1953 г. нашел, что распределение случай- 
ной величипы 


2* = zZ — (32 + г) /4п 
более близко к нормальному, чем распределение 2, при этом 


» жә т | 
г“ = 
п- 1 


ғ“ 


Следовательно, если верна гипотеза Но: 0і--фә, ТО 
—* = ж 


-- 


уа - дам 21) 


Таким образом, сравнивая | иокс| И ис, можно проверять 
Но. Критерий пригоден для малых выборок (п, =и2>10). 


~N :0; 1). 
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Пример ІХ-4 (Г. И. Арнаутова, 1982 г.). У Primula тасғо. 
сайух изучалась связь между числом семян на коробочку и 
массой семени. Для длинностолбчатых растений (Д-Форма) 
г, = —0,41 при Пі--26; для короткостолбчатых (К-форма) 
го-< —0,51 при по-+- 20. Существенны ли различия в силе связи 
между этими признаками у Д- и К-форм? 

По таблице ХП,а Приложения находим 210,44 , 
2. ==0,56; 
| 0,44 — 0,56] __ 
И 1123-17 
следовательно, Р(|й| >>иэкеп) »0,10. (Преобразование Г. Хо. 
теллинга в данном случае не вносит существенных изменений), 

Таким образом, нет оснований считать, что сила связи меж. 
ду числом семян на коробочку и массой семени различна у Д. 


и К-форм. 


0,38, 


| Изксп | == 


$ 9. РАНГОВАЯ КОРРЕЛЯЦИЯ 


Пусть (x1, 01), ..., (Ха, Yn) — выборка объема п из двумер. 
ной генеральной совокупности с непрерывной функцией рас. 
пределения F(x, y). G(x) и Н(у) — маргинальные функции 


распределения соответственно х и у. Требуется проверить гипо- 
тезу Но: F(x, у)--6(х)-Н(у) о независимости случайных 


величин хи у. 

Если функция распределения F(x, y) не имеет двумерного 
нормального распределения, то для проверки гипотезы Но не- 
обходимо предпочесть непараметрический критерий. Непара. 
метрический критерий следует предпочесть и тогда, когда в ка- 
честве альтернативы ожидается нелинейная корреляционная 
зависимость. Непараметрическую статистику для оценки связи 
можно получить, если в статистике коэффициента корреляции 


Пирсона г заменить случайные величины х; и у; их рангами 
К(х) и 0%(%), которые будем далее обозначать просто К; 
и @;: если 


n ~ ~ ~ - 
ЖУ Dia (xi — ту) (у; — ту) 


Мм— y 
V OEE A ак у: 
И (хета) а (%- ту)? 
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Символами Ю и 0 обозначены средние ранги, которые равны 
R= Q=1/2(n+ 1) (см. задачу 11-4). Напомним также, что 


ша (R; — R} = йы (9- Q; = туп (п? —1) (см. задачу Il-5). 


Подставив эти значения в выражение для га, получаем 
- n+1 в nti 
E n 22 Хе (А, — 2 (8. ми жа ? 


пто легко преобразуется в выражение, более удобное для Bhi- 
числений: 


24 


ИЯ 6 n үт Але 6р 
и па 1) 24 9, пада =. 


где --О;-1(Юі-0:)2. Эта статистика носит название стати- 
стики коэффициента ранговой корреляции Спирмена. Впервые 
она была предложена американским психологом Ч. Э. Спир- 


меном в 1904 г. Величина гз (каки г) может принимать зна- 
чения от --І до +1 и является мерой коррелированности pah- 


ГОВ Б, И О.. 


Подобно многим другим непараметрическим статпстикам, 
rs основана на комбинаторике всех возможных упорядочений 


рангов №; относительно 0;. Распределение ее можно вывести, 
используя следующую урновую схему. В двух урнах находятся 
по и шаров, пронумерованных от | до п. Шары извлекаются 


наугад парами, по одному из каждой урны. Пусть А; — номер 
і-го шара из первой урны, а @; — номер і-го шара из второй 


урны. А; может принимать значения — ... И и Qi также 
может принимать значения @;=1,. п. Нас интересует рас- 


пределение случайной величины База (8, О:)2, которая 
есть сумма квадратов разностей для всех п пар номеров. 
Чтобы найти это распределение, расположим пары случайных 


величин (Ri, 0!) в порядке возрастания значений Ri: 


Ки 129... п-, n; 
(0;: Qı, 002, ... (021, Он; 


Очевидно, что если Q, приняло любое из N возможных значе- 
ний, то Оз может принять любое из оставшихся (п— 1) зпаче- 
ний и т. A, Qn- может принять любое из двух оставшихся 
значений, наконец, Qn принимает единственное, оставшееся 
последним значение Таким образом, всего возможно 
П-(п--).....92.1--п! равновероятных наборов (перестано- 
вок) значений 0;. Поскольку значения, которые может прини- 
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мать случайная _ величина Ri, не зависят от значений случар. 
ной величины Qi, то столько же возможно наборов значений 
н для пар (В, 03). Следовательно, вероятность каждого та. 


кого набора значений равна l/n!, если Р, H 0, ЯВЛЯЮТСЯ 
независимыми. Чтобы найти распределение случайной величи. 


ны D, нужно подсчитать, сколько раз (а) сумма квадратов 
разностей 0) принимает значение D, и тогда ве. 
роятности P{D=D} ап задают распределение случайной 
величины D. Очевидно, что распределение. Ts с точностью до 


константы совпадает с распределением D. Распределение г; 
затабулировано (табл. АП! Приложения). 


Найдем математическое ожидание rs. Для этого сначала 


найдем математическое ожидание D, которую можно предста. 
ВИТЬ 


" RQ + У” 9 


Так как (А;, ..., Rna) п (Оі,..., Qu) суть перестановки целых 
чисел от | до п, то согласно Ше зультату в задаче П-5 


ъ R; Sa БЕ Q? = = п(п-- 1) (22+ 1). 
Следовательно, . 
D= =п(п + 1) (29 + 1) –2 У; RQ, 


Тогда математическое ожидание этой величины есть 
Еб = n+ (а +28 (У, 8,0), 
где, очевидно, 
Е |. 8,0, |--пЕВ, . EQ; Ата 1}, 
так что 


ЕЙ = 4 п п (п +- 1) (28 + 1) = an+! = п (r — 1). 


m~ 


B итоге, возвращаясь к величине fs, получаем 


си 65 1. 
Б--Е(1 ет о 


Таким образом, статистика 75 имеет все свойства коэффи- 
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шента корреляции и проверка гипотезы Но о независимости 
случайных величин сводится к проверке гипотезы Но: рв-<0 
о равенстве нулю такого параметра ps двумерной геперальной 


совокупности, оценкой которого служит статистика fs. 
Далее можно показать, что дисперсия статистики га равна 


гі, А 
Drs = п--1 


~ 


и нормированная случайная величина и при п--оо 
rs— Ers Г; 0 

у Drs i/y n—1 
Практически эта аппроксимация удовлетворительна при п>30. 


При п2>15 распределение г; хорошо аппроксимируется 1-рас- 
пределением с числом степеней свободы у==п—2: 


и = =rsVn—1 ~ М(0; 1). 


~ >~ и - 0 
t =f, И 7400) у= н — 2, 


Если среди значений х; и (пли) у; имеются совпадающие зна- 


~ 


чения, TO пм приписывают усредненные ранги и статистику U 
вычисляют с поправками Ty и Т, на совпадения: 


Е -4 + трият 
Ц- Тр (1- у) 


и* == 


где 7, = 1) 167—6) и Тат 2 в). 


здесь, в свою очередь, k — число групп совпадающих значе- 
ний Xi; с; — число совпадающих значений х; в |-й группе; 
[ — число совпадающих значений Yi, bg — число совпадающих 
значений у; в 5-й группе. 

Пример 1Х-5 (А. П. Виноградов, 1961 г., А. Ленинджер, 
1974 г.). В табл. 70 приведено содержание наиболее распро- 
страненных химических элементов (ат.0) в литосфере (ж) п 
в организме человека (yi). Связаны ли эти показатели между 
собой? 

Прежде чем. приступать к вычислениям, полезно предста- 
вить данные графически (рис. 53, а). Тогда становится очевид- 


ным, что статистическую связь между х; и у; (если она имеет- 
ся) вряд ли можно назвать линейной и потому для проверки 
гипотезы об их независимости применение коэффициента ран- 
говой корреляции Спирмена представляется более оправдан- 
ным, нежели коэффициента корреляции Пирсона. Действитель- 
но, связь между изучаемыми величинами становится гораздо 
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Таблица 7 


Содержание химических элементов (ат. $) в литосфере (х;) и организме 
человека (У;) (к примеру ІХ-5) 


----------------------------------------ш-т--ля-----------чч+--+- 
Злемент х; | У; | Р; 0; Р Q; (Ri— Q;)? 
ашыла ыы ыны сысы мыннан E R E --- 

11 3,0 60.3 9 10 —1 1 
О 58,0 25,9 10 9 1 1 
С 0,15 10,5 5 8 ЕЕ; 9 
М 0,025 2,42 1 7 --6 36 
Ма 2,4 0,73 8 6 2 4 
Са 2,0 0,23 7 5 2 4 
р 0,05 0,13 4 3,5 0,5 0,25 
5 0,03 0,13 3 3,5 --0,5 0,25 
Қ 1,4 0,036 0 2 4 16 
СІ 0,026 0,032 2 1 1 1 


наглядней, если предварительно ранжировать выборочные зна 
чения (рис. 53, 6). 


у, ат. Чо а 0; 6 
60 ен 10 OH 
(90 
әб 
ФМ 
30 «Ма 
әсер 
| 52 K 
ШЕ т. Ка Е 
0 Do xat% 1 ell Ri 
"ә. Fee ал 22221. 8 
90 60 1 9 10 


Рис. 53. Содержание химических элементов в литосфере и 
в организме человека. 


а — исходные данные; Ő — ранжированные данные (пример ІХ-5). 


Значения рангов А; и Q; показаны в табл. 70. Двум совпав 
шим значениям 0(3у== 04)==0,13 приписываем усредненный ран 
Оз-- Q= (3+4) /2==3,5. Очевидно, что сумма разносте 
Уг 1(5;:—0:) должна быть равна нулю. 

Находим сумму Ю=Х;° 1(А;—0:)2=79,5 и вычисляем 


6. 72,5 


1— т (10° — 1) 


r — 0,56. 


= 


Чтобы оценить достоверность наблюдаемого значения ран- 
гового коэффициента корреляции, необходимо знать распреде- 


ление статистики rs в случае, когда ps=0. Для п--10 это 
распределение показано на рис. 54. Оно получено перебором 


Pi (Ts), % 


-1,0 “05 0 0,5 1,0 


Рис. 54. Распределение статистики г; коэффициента корреляции Спирмена 
при п = 10. 
Сумма заштрихованных площадей есть а == 0,0498 = 0,05. 


п! ==10!=3 628 800 всех возможных перестановок для пар 
чисел Бі--іІ, ... 10 и О:-+1, ..., 10 и подсчетом числа 
встречаемости каждого из возможных значений rs. Заштрихо- 
ванные области на хвостах распределения соответствуют ве- 


роятностям Р{/5—<— 0,65} =0,0249 и  Р(г52>>0,65) =0,0249. 
Найденное нами значение не попадает ни в одну из этих об- 
ластей, поэтому нет оснований отклонять нулевую гипотезу на 
уровне значимости о--0,05. 


m~ 


Поскольку распределение rs симметрично относительно 
пуля, то в таблицах приводят лишь положительные значения 
fsa) (n), т. е. такие, для которых Р{|75| >гео(п)|-<- а. В на- 
шем случае |75|==/5(,05) (10) =0,56 и поэтому наблюдаемую 
корреляцию можно признать значимой лишь на уровне о/--0,10. 
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$ 10. КРИТЕРИЙ x? КАК КРИТЕРИЙ НЕЗАВИСИМОСТИ 


Пример 1Х-6 [Фишер, 1958]. Шотландские дети, отдельно 
мальчики п девочки, были расклассифицированы по признаку 
цвета волос (табл. 71). 

Таблица 71 


Цвет волос у шотландских детей (к примеру 1Х-6) 


Цвет волос 


Пол | И қ каштано- қ 
белокурый| рыжий русый Бий черный всего 
Мальчики. ... 592 119 6-49 594 36 2100 
Девочки: .... 044 97 677 451 14 1783 
Всего ци“ 1136 216 1526 955 50 3883 


В этой задаче речь идет о классификацин каждого ин- 
дивидуума по двум признакам: по полу и по цвету волос. 
К данным, представленным в таблице сопряженности призна- 
ков, необходимо применить критерий независимости, т. е. от- 
ветнть на вопрос, есть ли связь между признаками «пол» и 
«цвет волос». Однако задачу можно сформулировать и по-дру- 
гому: есть две выборки (мальчики и девочки) и сравниваются 
два выборочных распределения признака «цвет волос», T. е. 
мы вернулись к критерию однородности из $ 3 гл. УП. 

Действительно, математически критерий однородности и 
критерий независимости идентичны. Различие заключается в 
биологической постановке вопроса. В следующем при- 
мере, с точки зрения биолога, есть смысл говорить лишь о кри- 
терии независимости. 

Пример 1Х-7 [Рокицкий, 1973]. Оценивалась конституция 
каракульских овец при рождении и в полуторагодовалом воз- 
расте (табл. 72). Есть ли зависимость между конституцией 
ягнят в разном возрасте? 


Таблица 72 


Конституция каракульских овец в разном возрасте 
(к примеру ІХ-7) 


В полуторагодовалом возрасте 


При рождении Всего 
нежная | крепкая | грубая 

Нежная ...... 16 22 21 $9 

Крепкая ...... 15 485 325 826 

Грубая »::-:%% 28 190 374 59 

Всего сирена 59 727 _ 121 1507 
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$ 11. ОБ ИНТЕРПРЕТАЦИИ СТАТИСТИЧЕСКИХ ЗАВИСИМОСТЕЙ 


Пример 1Х-8 (Н. А. Агаджанян, А. Ю. Катков, 1981 г.). 
Западногерманский врач-онколог Э. ван Аакен наблюдал за 
500 пожилыми бегунами и 500 небегающими людьми той же 
возрастной группы в течение шести лет. За это время 29 небе- 
гающих заболели раком, а среди бегунов заболело раком 
только четверо. Результаты наблюдений можно представить в 
виде таблицы сопряжепиости 2X2 (табл. 73). 

Таблица 73 


Таблица сопряженности 2X2 для данных примера 1Х-8 


Пациенти Заболевшие Здоровые Всего 
Бегуны....... 4 496 500 
Небегаюшие,.... 29 471 500 
Всего бысы корк 33 967 - 1000 


Имеем х?:‹в==18,05; Р(у2->у%ксп) <0,001. Налицо явная 
отрицательная корреляция: занятия бегом сопровождаются 
низкой заболеваемостью раком. 

Можно ли па основании этих данных рекомендовать пожи- 
лым людям бег в качестве эффективного средства борьбы с ра- 
ком? Очевидно, ист. 

Здесь мы имеем наглядный пример того, как наличие ста- 
тистической связи не выявляет и не указывает направле- 
ния причинно-следственной связи. Действительно, 
наравне с выводом о том, что бег является причиной низкой 
заболеваемости раком, правомерен и обратный вывод: бегом 
предпочитают заниматься здоровые люди. 

Для того чтобы сделать выбор между этими альтернатива- 
ми, нужны внестатистические соображения. Напри- 
мер, следовало бы изменить схему эксперимента: часть пожи- 
лых бегунов должна была бы прекратить занятия бегом, 
а часть небегающих должна была бы начать регулярные заня- 
тия бегом. Ясно, что такая насильственная ситуация непрнем- 
лема, и потому столь неоднозначными бывают выводы из TMO- 
добных исследований. 

«Статистическая зависимость, как бы ни была она сильна, 
никогда не может установить причинной связи: наши 
идеи о причине должны приходить извне статистики, в конеч- 
ном счете из другой теорпи... Нам нет нужды углубляться в 
философское обсуждение этого вопроса; для наших целей не- 
обходимо только еще раз подчеркнуть, что статистическая за- 
висимость любого сорта логически не влечет причинной. .. 

Последователи Карла Пирсона и Юла в первом приступе 
энтузиазма, порожденного корреляционной техникой, легко де- 
лали опрометчивые выводы. Это продолжалось до тех пор, 
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пока... Юл (1926) не напугал статистиков примерами высоких 
корреляций, которые, очевидно, не выражали причинных свя- 
зей... Большинство этих ,,бессмысленных” корреляций дейст- 
вует через сопутствующие изменения во времени. Упомянутые 
примеры имели благотворный эффект, доводя до созпания CTA- 
тистиков, что причинная зависимость не может быть выведена 
пи из какого наблюдаемого совместного изменения, даже са. 
мого тесного» |Кендалл, Стьюарт, 1973, с. 374—375]. 


Задачи 


ІХ-1 (В. Уэлдон, 1906 г.). Из 12 игральных костей половина окрашена 
в красный цвет, половина — в белый. Испытание [ заключается в одновре- 
мепном подбрасывании 12 костей и записи суммы выпавших на пих очков, 
Испытание П состоит в том, что кости, окрашенные в красный цвет, остав- 
ляют па столе в том положении, как они выпали в испытании [; кости, 
окрашенные в белый цвет, снова подбрасывают; записывают сумму очков, 
выпавших на 12 костях. Будут ли испытания І и ІІ независимыми? Как бы 
вы смоделировали в такого рода эксперименте варьирование силы связи 
между испытаниями Ги П? 

[Х-2. Измеряются два признака листа: 1) длина пластинки и 2) длина 
листа, т. е. сумма длины листа и длины черешка. Будут ли эти признаки 
независимыми или скоррелированными? 

1Х-3 (Терентьев, Ростова, 1977]. Оцените связь между массой тела и до- 
лей, какую масса мозга составляет от общей массы у обыкновенного тюленя: 

Масса тела, кг... 7,5 12,5 17,5 925 37,5 27,5 325 

Масса мозга, 0... 4,10 2,24 112 0,85 0,55 0,68 0,55 
Требуется ли здесь линеаризирующее преобразование? 

ІХ-4. Проведите статистический анализ данных из примера ІУ-18 (см. 
табл. 14). 

ІХ-5. Проведите статистический анализ данных из примера ІУ-19 (см. 


табл. 15). 
ІХ-6. Покажите, что 
— п 1 п n 
2. (х; – т.) (9 — ту) = 2А, х;у; n реа Xi ра Yi 
IX-7 ея 1977]. Скорость крови определяли двумя методами: обыч- 
ным, путем пепосредствепного измерения, и новым, технически более про- 


стым (табл. 74). Если новый метод дает те же результаты, то коэффициент 


Таблица 74 
Результаты измерения скорости крови обычным (х;) 
и новым (у,) методами (к задаче ІХ-7) 


*j М 1 7; 
1190 115 | 2335 2280 
1455 1425 | 29490 2520 
1550 1515 2729 9630 
1730 1795 | 9710 9740 
1745 1715 2530 2390 
1770 1710 | 29900 9800 
1900 1830 | 9760 2630 
1920 1920 | 3010 9970 
1960 1970 | 

2995 2300 | 


регрессии должен быть равен единице. Проверьте эту гипотезу. Можно ли 
для решения возникшей у физиолога задачи привлечь другую статистиче- 
скую модель помимо линейной регрессии? 
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ІХ-8 [Урбах, 1975]. При облучении гамма-лучами наблюдается падение 
активностн фермента (в % к контролю): 


Доза KP (D). до ааа 0 3 7,5 15 30 45 60 
Активиость фермепта (А). . . 100 81,5 770 399 21,8 10,7 4,43 


Предполагается, что активность фермента убывает по показательному зако- 
ну А- Аце 10 . Оцените коэффициент y. 

1Х-9 [Урбах, 1975]. Изучалось уменьшение темпов размножения двух 
штаммов бактерий при рептгеновском облучении (в % к контролю): 

Доза, КР... 12345 6 7 


1-й штамм. .. 96 87 83 77 71 63 62 
2-й штамм... 93 88 85 73 73 67 — 


Сравните кривые доза—эффект. 

[Х-10. Давалась оценка хлебопекарного качества муки простого помо- 
ла О после прогревания ее при 170° Е в течение различных периодов вре- 
мени (часы, Т): 

Т... .0,25 050 0,75 10 15 20 30 40 60 8,0 
0... 93 71 63 54 43 38 29 26 22 22 
Постройте график. Попробуйте использовать преобразования 167, 16 0. 

Проведите регрессионный анализ. 

ІХ-11 [Терентьев, Ростова, 1977]. Следует ли проводить оценку коэффи- 
циента корреляции г между числом боковых побегов и высотой растепия 
у нивяника обыкновенпого (табл. 75)? 

ІХ-12. Проведите статистический анализ данных из примера ІХ-6 (см. 
табл. 71). 

ІХ-13. Проведите статистический анализ данных из примера ІХ-7 (см. 
табл. 72). 

Таблица 75 

Распределение числа растений нивяника обыкновенного по количеству 

боковых побегов и по высоте растений (к задаче ІХ-11) 


Количество боковых побегов 


Высота я | | | Е | Е | р | 5 | Е | Е 
Зо 13 1 
45 62 6 3 1 1 
55 51 6 8 4 1 
65 17 0 8 5 3 1 
75 1 2 1 1 1 1 1 1 


Таблица 76 


Полярность (х;) и гидрофобность (у;) аминокислот (усл. ед.) 
(к задаче ІХ-14) 


Аминокислота | х; Yi Аминокислота | х1 У; 
Аланин........ 000 | 0,87. Лейцин ...... 0,13 2,17 
Аргинии....... 52,00 085! ИН е дори 49,50 1,64 
Аспарагин ...... 3,38 0.09 | Метионин , . . . . 143 1,67 
Аспарагиновая кислота | 49,70 0.66 и Пролин...... 1,58 2.17 
Валин. ........ 043 | 187 | Серина, 167 | 007 
Гистидин....... 51,60 | 0,57 | Тирозин ...... 1,61 2,67 
Глициа........ 0,00 | 0,10 | Треоннин...... 1,66 | 0,07 
Глутамин....... 3,53 0,00 | Триптофан..... 2,10 | 3,77 
Глутаминовая кислота .| 49,90 | 0,67 | Фенилаланин , . . .| 0,35 | 2,87 
Изолейцин ...... 0,13 3,15 | Цистеин...... 1,48 1,52 


12 
(2 


Таблица 77 


Распределение ранних цветков Ranunculus ficaria по числу тычинок (Х1) и числу пестиков (Хо) (к задаче ІХ-15) 


М 
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х 


37 | 38 


36 


34 


33 


32 


31 


30 


29 


27 


26 


25 
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Таблица 78 
Распределение объема груди и роста (центральные значения интервалов 
в дюймах) для 4995 женщин Великобритании (1951 г.) (к задаче ІХ-21) 


СЕРА ЕЕК НЕЕ e ЕТ УЕ ЕЕ ЕЕ атн 


Объем груди рост) 


(51) 


54 ss | в | æo | е | s: | æ | s | 0 | [о | 9 
56 l ] 
54 l 2 3 
52 1 3 4 1 1 10 
50 1 З 5 4 | 14 
48 1 3 9 T 6 3 | 30 
46 4 11 17 17 7 1 57 
44 2 11 26 50 45 17 10 1 169 
42 2 11 42 85 73| 31 12 3 2 261 
40 2 90 76 | 132| 131| 71 9! 9 4 |3 479 
38 2 36 98 158| 203 | 126 65 | 17 311 709 
35 6 48 | 188 | 3171 4101 263 80 | 15 1 1337 
34 | 9 67 | 210 | 376| 427| 196 59 8 1353 . 
32 3 5 39 | 131 1631 122| 31 8 | 1 504 
30 1 4 11 18 25 10 2 71 
98 2 1 1 4 


Всего...) 5 | 33 | 254 | 813 |1340|1454| 750 1 275 | 56 | 11 | 4 | 4995 


1Х-14. Структурными элементами белков обычно служат 20 капониче- 
ских амннокислот, важными характеристиками которых являются полярность 
(ха) и гидрофобность (у:) (табл. 76). Выясните, скоррелированы ли эти 
свойства. Какой критерий следует применить и почему? 


ІХ-15 [Тыокн, 1981]. Проведите корреляционный анализ данных, пред- 
ставленных в табл. 77. 


ІХ-16. Докажите, что при п=2 и р= =. P{r=1}= P(r =—1}=1/2. 


IX-17. Используя тот факт, что (5- —В)/5ь ~ (у), у=п—2, постройте 10- 
верительный интервал для коэффициента линейной регрессии В. 


1Х-18. Постройте доверительный интервал для коэффициента корреля- 
цин р. Какое свойство: 


гуп 2 ~ #(у), у= и – 3, или Z— Ez ~ М (0; 1) 
И! -— r V Dz 


— следует для этого использовать? 

ІХ-19. Предложите критерий для сравнения нескольких (А) независимых 
коэффицнентов корреляции. 

1Х-20. Проведите корреляционный анализ для парных наблюдений из 
примеров \1-4, У1-9 и задач УІ-8, У1-9. Почему в этих случаях применяют- 
ся парный #-критерий или парный критерий Вилкоксона? 

ІХ-21 |Кендалл, Стьюарт, 1973]. Проведите статистический анализ дан- 
ных, представленных в табл. 78. 

1Х-99. Проинтерпретируйте следующее высказывание Бернарда Шоу 
(1906): «Даже опытные статистики часто оказываются нс в состоянии оце- 
нить, до какой степени смысл статистических данных искажается молчали- 
выми предположениями их интерпретаторов... Легко доказать, что ношение 
цилиндров и зонтиков расширяет грудную клетку, удлиняет жизнь и дает 
относительный иммунитет от болезней... Университетский диплом, ежеднев- 
ная ванна, обладание тридцатыо парами брюк, знание музыки Вагнера, 
скамья в церкви — короче всё, что подразумевает большие средства и хоро- 
шее воспитание, ...может быть с помощью статистики представлено как 
магические чары, дарующие привилегни любого сорта». 
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РЕШЕНИЯ ЗАДАЧ 


1-1. а) Урна содержит поровну белые и черные шары, символизирующие 
гаметы, несущие аллель А или аллель а соответственно. Шары извлекаются 
парами, каждая пара символизирует гснотип зиготы. 6) Урна содержит по- 
ровну белые и черные шары, символизирующие пол новорожденного ребец. 
ка. Шары извлекаются по одному. 

1-2. а) мишень — отрезок (0, оо]; 6) мишень — отрезок (0, d]; в) ми. 
шень — отрезок [0, 100]. 

1-3. а) А.ПАз= означает, что отрезки (а, bi] и (аҙ, 5;| не пересекают. 
ся; б) а и означает, что отрезок (а, bıl Соро в (аҙ, 64, т. е 
духа <; <; А|)А»-- А» означает то же самое; АА=0 означает, что 
либо ё, <а2, либо Ё <ај. 

1-6. Р(БЧК) =1/4. Белая окраска появляется в двух случаях: когда вы. 
падает белая грань и когда выпадает грань БЧК; следовательно, 
Р(Б) =1/4+1/4=1/2. Аналогично Р(Ч)--Р(К)--1/9. Далее, два цвета одно. 
временно появляются лишь в случае выпадения грани БЧК. Поэтому 
Р(БЧ) --Р(БК) =Р(ЧК) =1/4. Отсюда и следует, например, что Р(БЧ) = 
шаха Р(Ч), но Р(БЧК) >Р(Б) -Р(Ч)-Р(К). 

-8. а) Вероятность не получить 6 при бросании одной кости равна 5/6, 
а 5. бросании четырех костей — (5/6)*. Следовательно, искомая вероят- 
ность равна 6— (5/6) 0,518. б) Вероятность того, что на обеих костях BH- 
падет 6, равна 1/36; вероятность того, что этого не произойдет — 35/36. Ве- 
роятность того, что при двадцати четырех бросаниях не выпадет две l, рав. 
на (35/36) 2+. Следовательно, искомая вероятность равна 1— (35/86) 220,491. 

1-9. Обозначим медали первого ящика Зи, 32, второго — Сз, C4, третьего — 
3s, С. Если первой извлечена золотая медаль, то ею равновероятно могут 
быть 31, 32 или 35. Только один из этих трех равновероятных исходов — 3;, 
влечет событие: «вторая медаль — серебряная». Следовательно, искомая веро- 
ятность равна 1/3. Тот же результат имеем, если во вскрытом отделении обна- 
ружена серебряная медаль. 

1-10. а) Вероятность того, что данный человек родится в данном меся- 
це, равпа 1/12. Вероятность того, что 12 человек родятся в заданные меся- 
цы, равна (1/12)!2--|2-12 Так как месяц рождения для каждого человека 
не оговорен, то число возможных размещений 12 человек по 12 месяцам 
равно 12! Следовательно, искомая вероятность равна 12!. 12—12=11!. 12-1 = 
—=0,000054. 6) Вероятность рождения одного человека в заданные 2 месяца 
равна 1/6, а шести человек соответственно (1/6)6=6-6. Число возможных 
размещений шести человек по двум месяцам равно 28. Число возможных 


сочетаний по 2 месяца из 12 в году равно Cis = —5—=66. Искомая вероят- 
ность равна 6-6.25.66=3-6. 66х:0,091. 


Эта задача иллюстрирует замечание французского математика Эмиля 
Бореля: «...как только задачи на вероятности становятся сколько-нибудь 
сложными, здравый смысл, даже руководимый светлым и глубоким умом, 
не можст обойтись без помощи вычислений; он ведет самое большее к выво- 
дам... неполным и расплывчатым. . .» 


11-3. Обозначим для краткости Ех = т. Тогда 


со 
Ых--Е(х- т): = < і-- т) — Ў (i — 2im + m°) pi = 
i=-0 ізе0 
со 
са вр; — т Ў ір; + т? У = ER — 2m. т + m= Ех: — (Ех)?. 
[=9 і--0 


ғ“ m 


11-6. Пусть {р:,} — совместное распределение случайных величин х; и Хо. 
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Тогда 
~ ~ я со t со К 
E (Xi +) = Dio Do HD Py = Diao Орай 
со Фо Е со А ~ ! А 
+ а х ри = ра go "РЕ + №, 0/0) = Ех +t Ех». 
11-7. Так как 
D (X3 5) = Е а + хо) — [E (мо = Е (2, + 0) — 
— (Ех, + Ех)! = EX? + 2E (Xix) + EX3 — (Ех)! + 2ЕжЕхо + 
+ (Ex)? = | Exi Е (Ехо) ЕЕ | Ex; = (Еж) +2 [E (ха) — ЕхЕхо!|- 
= рӯ + ря, + [E (1х5) — ЕжЕх., 


TO следует „Убедиться в том, что для независимых случайных величия 
E(x, x2) = Ех.“ „Ехо. Имеем 


Е (хо) = >. (ааа b ‚ о МРи= 2. 2. o Pi Р. = 
= 2. p) >. АР = Ех Ех.. 


П-8. По теореме П-5 $ 3 имеем 
КУЛ (Y) -Ja (У) = е (00 e (0-0) оа) (0) ще), 


где A= + А. 

1-9. На первый взгляд согласуется. Однако у нас нет объективного 
критерия, который бы оценил это. В гл. УП такой критерий будет дан 
(см. задачу УП-16). 

Для вычисления ожидаемых частот р(!) и численностей пр(!) используй- 
те рекуррентное отношение 


SAP 22; 
Р( Ipag’ 
а именно: 
p (0) = q” = (2/3)!° = 0,0077073; пр (0) = 202,75; 
р (1) -+ 2р (0) = 12. ӯ . 0,0077073 = 0,046244; пр (1) = 1216,49; 
1 1/3 


o (2) == ' £ pM = 112-75 -Р (4) = 012717; пр (2) = 3345,33 и т. д. 


91 (1\9 
П-10. Вероятность того, что все 9 детей — девочки, равна 7715) == 


9° = 515 “0, 002. Мала или велика эта вероятность? Этот вопрос обсуж- 
дается в $ 2 гл. IV. 

11-11. Для вычисления ожидаемых частот р(!) и численностей пр(4) исполь- 
зуйте рекуррентное отношение 


т . 
pP i+ = ттт Р (9, 


1 
p (0) = 07 тое-т--е`Т— 0,8147: 


15 Зак.№ 122 995 


pil = Z p (0)-- 0,1670; 


p = 5-р (1) = 0011 и т.д. 

кода со. 252) о œ 

Ш-2. E (xx) = | | xyf (x, yjdxdy= { {хул (х) № у) ахау = 
= о = z 


-со 
о о о _ С: 
=} хло) | ул) ay ) dx= | ху (х) ах Ex, | xfi (б) de= 
_© — с , - о — о 
Ех ы Ех.. 
Бә 27 | 
ІШ-3. Ву (БЕ. нь )= ЕЕЕ 
V Dx y рх 
5 "х-- Ех 
рӯ= р Еа у }=2 == (05 — 0) =1. 
Ш-4. 


a) Ф(0)--0,5; 61 Ф(-1)--0450; в) 0 (2) = 0,977, 
а) Р(-2<и<2)-Ф?2)-Ф(--3)-0,977-.0):4 
6) Р{—1<и< æ; == Ф (о) —- i 
ЖІГЕРГЕ 


H-3. 


z 0.975; 
(—1)=1 — 0,159 0,841; 
Ф 1) = 0,341 — 0,159 = 0,682. 

e) Pilu |2) 0,955; 

ә Р(2| < 3} = 0,9973; 

ӘРІ < 3} =1-—Р {|2 | < 3) = 1 — 0,9973 = 0,0027. 
ni-s, Ра [<] =1 - Ра < —1} 
(1 — 0/2, 


--1--2Ф (--ү)=8, откуда Ф {—1)= 
== Следовательно: |) (1 — 3)/2 = 0,05, 1 = 1.64: 2) (i — 3)12 = 0,025, 
y = 1,95; 3) (1 - 8)/2 = 0,005, ух 2,58, 


1-7. Так как для нормированного нормального 
= (z =a); 42, ТО х=из+и=9и + l. Поэтому 


P{-3<%<7}=P {3 < (а +1) <1!- 
-2(-9<ш<3)--Ф(3)- 


Ш-5, Аналогично задаче 


— 


распределния и = 


Ф.--2) = 0,978. 


11-7 x= из +u = u + 4, откуда рг РА 
=4и + 8-7 = 4и + 1. Неравенство | 42 + 1 | < 2 эквивалентно — 2 < iu + 
+1 < 2, или —0,75 <и < 0,25, откуда 


Рәт от |е) 


—1—Р|[— 0,75 < и < 0,25) =1—Ф (0,25) + Ф (0,15) =: 0,628. 


Ш -9. Случайная величина Х == х] — Хо имеет пормальпое распределение: 
xı - хо. ~ N (-1; И5 ). Следовательно, X = us + u=V5 и—1, откуда —4 < 


< Иби – А < 8; — 1,34 ы и и < 4,02. Значит, искомая вероятность равна 
$ (402) = (2 1,34) = 9,91 
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111-10. Случайная величина х = ху +2 27 3 распреде лена по кормаль- 
ному закону с u = ш + дуо — З = 3; =c + 45} =9 + 64 = 73, Следовае 


гельно, |х, + 2X9 - 3| < 8 эквивалептно неравенству |х |< 8. Далее, x= 

па + e= u И 73-Е 3, откуда искохая вероятность равна 
о ыры өт ^5} = 0,375. 
11-11. х= 50 +2, откуда -4<5ш--2<3 ғ, ИЛИ sAn лі < 


о! о 
= i 
“М. - - - 
5 о 
Следовательно, 
ж д Ұқ д = 
р | |51 < ЛЕ --Ф Будан ч 0005, 
о 5 / 
д q+ +2 қ 
г. е. по таблице надо найти такое значение ò= +, что Ф[— ё] + 


2 
+ Ф| — (5 — 0,8)| = 0,05. Из таблицы находим, что при 6=2,51 это равен- 
ство почти выполняется. С ледовательно, y= 9-10, 55. 


111-12. По определению 2 = 4 :, поэтому, Еу? = Eu: 2—2 Пиза |; ру? БУ 
а 7912 ~9\ > ~y? рер 
= Ё ЕТ - Е11 - Е(х1) == (Ез) = Би! — 1. 


Имеем 
129 1 29 1 
— — — да - --- x? / 9 
Ей | х! ЖР 2 ж--| $ xe 2 =) 
— со Иж -o у 2л \ 2 
г. СО 1 р со 1 со 
. аи 22:82" с, -2, 
жа бы 2 | == ха (е у: ( 75 306 7 Еа = хе х 12 | сылы 
Jœ V 2% Қ ЖЕТЕК г ұ2- же 
со 
= | х? Да eT “В их = ЗРи == 
_ о И 2z 


откуда D% =3—1= =2. 
11-18. а) Р<0,001; 6) P<0,025; в) Р>0, 975. 


111-14. а) P{t>2,2}=0,025; 6) РН > >.2,2)--0,05; в) у=2,36; г) у=3,50. 
111-15. а) 0,005<Р< 0,01; 6) 0,01<Р<0,025; в) Р<0,0005. 
|У-4. При построении обычной (линейной) гистограммы за точку отсче- 
га на оси абсцисс возьмите х;=140° либо постройте круговую TACTO- 
грамму [см.: Мардиа, 1978]. 


У-1. Функция правдоподосия /. (Ө) = С? Ө? (1—@)"-*, ес логарифм 1а L= 
= ІП С" + Е т@ + (п —– А) т (1 — Ө); уравнение правдоподобия а — 
k n—k 0 ерес 
= 5 -T6 = ‚ откуда = 


--- 


ЕЗ х; S A 
V-2. Функция правдоподобия L (Ө) = (e 7:9 ) 520 [e е 6 а 


xı! Ха!, 
— ne өз ех, | 
ее арр ее логарифм Іп [= — n9 + (ху... + хь) In ө — 
11... Ха 
дп L) п 1 
— In (х1... ха); уравнение правдоподобия — =n > м5 = 0, 


1 
' откуда © = F > Xi. 


15* 907 


n! k k 
EEEE ЕЕ л l 
= Тел... R 0%. 
Так как Ө, +... +- Ө; =1, то независимы только (/ — 1) из них — 9}, . 


М-3. Функция правдоподобия L (91, ..., 9;) 


пі 
Ө;_1, а 9; =1 — 8, —...— Ө; |. Поэтому In L = = 18 тру +6, +. Жет 


+ kia ln Oia + Ат (1—9, —... — 9; |). Решаем (/--1) уравнений правдо. 
подобия: 


д (Іп L) oky РІ 
Е 99; ево ере 
откуда 
(Ө; = Е; (1 — 9, — ... — Ө; 1. 
Суммируя обе части последних уравнений по i = 1, ... , / —– 1, прибавляя 


затем к каждой из них 2/0, получим А; = пӨ,, поскольку 2. 9; =! и 
l 
йа В =п. Отсюда 2/9, =пти Ө; = #6 Е; = kiln. 


Mw 


У-4. Пусть | — математическое ожидание случайных величин х,..., а 
Тогда для каждого і 


(хұ--т)-ч(х;--з)--(т-іУӘГ--(х;-- и)? — 2 (xi — в) (т — №) + (х — 1) 
и 


as n жу Ao А 2 ~ 
п5 фес 2 (xı — В) — 2(т-- u) Dti (х — в) + n(m — u} = 
тис (т — u), 


779 ~g 9 — 
1“ v /ж- т — Xi — 
откуда — == (Е не) 4 4 Так как ~ = Е распределена 


пат: б 


7 т — „| 
со средним 0 и дисперсией 1, а ZZE со средним 0 и дисперсией = 
б 
с? 1 п- 1 - п — 1 
(см. гл. У), то М (8-і Ге Ms? = в. Отсюда 
6: 


п ~ 7 ~ l ` ~ x 
же следует, что M ят 50 | == 9° т. е. оценкаб!------ д, |(Х-пт) 
несмещенная. 


У-5. Доверительным интервалом является область всех возможных зна- 
чений, принимаемых случайной величиной. 

У-6. п=245; т=174,5; 52=70,06; 5--8,37; 5т--0,535; 0--4,8%; у=244; 
[0,025 (244) = 1,97. С доверительной вероятностью 0,95: 173,4 << 175,6; 
57,11<62< 83,02. При вычислении доверительного интервала для 0? исполь- 
зуем нормальную аппроксимацию, так как п>30. 


У-7. п=15; т--1,47; 52--0,0452; 5--0,213; $. =0,0549; о--14,5%: у=14. 
Из табл. Ш и У Приложения 10,025(14) =2,14; X8 0 (14) =5,63; Xô 9:5(14) = 
==26,1. С доверительной вероятностью 0,95: 1,35<и< 1,59; 0,024 <02< 0,112. 

У-8. һ--0,232. Поскольку пһ(1--һ)>25, используем нормальную аппро- 
ксимацию: Үй(1--й)/п--0,0086 и с вероятностью 0,95: 0,215<р< 0,249. 


У-9 (см. пример У-3). Ответ: #--0,04. С вероятностью 0,95 процент 
больных диабетом в данном районе находится в интервале от 3,1 до 4,9. 
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V-10 (см. пример У-5). Ответ: т=42. С доверительной вероятностью 
0,95 среднее число колоний на чашке находится в пределах 29,3—54,7. Mo- 
верительный интервал очень велик, поскольку п= 1; однако в случае распре- 
деления Пуассона его все-таки можно оценить. 

V-11. (1—@а) 100%-ный доверительный интервал для среднего квадра- 
тичного отклонения O нормального распределения задается соотношением 


y y 
$ — 5222 8 — 
Дао Laj? 


V-12. Доверительный интервал для математического ожидания пр бино- 


миальной случайной величины х имест вид при <пр<пру, где рн и рв-- 
нижняя и верхняя границы доверительного интервала для параметра р (см. 
$ 5). 

V-13. паң <п\<пАь, где Ан и А — нижпяя и верхняя границы дове- 
рительного интервала для параметра Л (см. $ 6). 

МТ. п, =12; n=12. Используя преобразование Ух-- 0,386, получаем 
т, = 1,46; Sm, =0,174; то 1,92; Sm, =0,134; у=22; |ѓэәхсп |=2,09> 0,005 (22) = 


--2/07. О эксп =37,5; EU=72; Е=4; с1=6; со=3: сзу==6; са--2; DU=291; 
|4 эксп | --2,02->Ио,025-< 1,96. Способ ІІ более эффективен на уровне значимо- 
сти @&=0,05 как по критерию Стьюдента, так и по критерию Вилкоксона — 
Манна — Уитни. 

Если не использовать преобразование, то ти--2,1; m:=3,5; Sm ‚ =0,57; 
бта=0,50; |Ёэксп | = 1,85< 0,095 (22) =2,07 и мы приходим, по-видимому, к 
ложному выводу 06 отсутствии различия между двумя способами борьбы 
с насекомым. 

У1-2. Представленные данные, несомненно, являются зависимыми, т. е. 
парными наблюдениями (см. задачу 1Х-20). Поэтому п=5; та=2; 5а--0,52; 
у=4; |Еэксп | =3,85> 0,025 (4) =2,77. Увеличение чистого дохода от примене- 
ния усиленного удобрения оказывается статистически существенным на уров- 
не значимости @&=0,05. По-видимому, имеет смысл применять усиленное 
удобрение, так как затрата на него каждого лишнего фунта дает прирост 
прибыли в среднем на два фунта (та--2), т. е. окупается вдвое. 

Если бы мы рассматривали эти данные как независимые выборки, то 
имея Пі--П2--б; т-- 18,5; то-:20,5; Sm, =1,432; зта-< 1,688; у=8; |Ёфкеп |= 
=0,90<К,о5 (8) =2,31, мы пришли бы к неверному выводу о незффективно- 
сти усиленного удобрения. 

\У1-3. Лечение методом А и методом Б можно назначать попеременно 
по мере появления случаев заболевания. 

\]1-4. А=0,056; Ро--0,361; #--0,193; п=457. Так как п!й>5 и 
п: (1—1) >25, можно применить и-критерий: |иэксп | =8,22>> uo,0005 = 3,29. 
Благотворность действия антикоагулянтов несомненна: Р{и>иэксп }< 0,001. 

М1-9. т; = 124,9; т. = 101,0; s? == 618,81; s? = 425,33; $1 = 24,83; 59 = 20,62; 
Sm = 9,39; Sm» = 7,1,9: *=12; | кеп [= 1, < (0025 (12) = 2,18. Разница между 
средними прибавками массы у крыс незначима при а == (0,05. 

\У1-6. у, =999; у= 138. Для длины черепов Рэксп =1,16< Еов-< 1,23 и для 


ширины Езксп --1,20<Ғо.05-- 1,23. Изменчивость обоих признаков у современ- 
ных европейцев и древних египтян не различается при о0--0,1. 

\У1-7. у,=11; %2=4; т =0,296; m=0,4l; 57--0,00088; 52 =0,0040; 
52--0,0017; у=15; |ѓэксп |--5,18>>о,0005 (15) =4,07. Различие штаммов вируса 
гриппа по фоточувствительности высоко значимо (при &=0,001). 

К подобному же выводу, но с меньшими вычислениями мы приходим, 
используя критерий Вилкоксона — Манна — Уитни. Для этого достаточно 
заметить, что для штамма «Техас-77» все значения, кроме одного (0,34), 


меньше всех значений для штамма «СССР-77». Значит, (эксп =0,5; EU =30; 
DU=90; | изксп |=3,11 >uo,001 = 3,09, т. е. различие значимо при о--0,002. 
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УІ-8. у=17; ти=2,1; 5а=2,60; |Ізкеп | --0,81<<10,05 (17) = 1,74. По парно. 
му критерию Стьюдента паблюдаемые различия незначимы при а--0,1, т. в 
можно считать, что артериальное давление восстанавливается после прерн. 
вания кровотока с последующим его возобновлением. Используя парный 
критерий Вилкоксона, приходим к тому же выводу: М--15; Шэксп --44,5. 
ЕМ =60; DW=307,4; Е--2; сі--5; Со--2; | изксп | = 0,88 <ио,05 = 1,64. 

\1-9. у=9; та=1,58; 54--0,389; |Ёэксп | =4,06 >, (9) =3,25. Снотвор. 
ное А существенно лучше снотворного В (при а=0,01). Если бы мы рас. 
сматривали эти данные как независимые, то пришли бы к неверному выводу 
06 отсутствии различий: т; =2,33; то--0,75; vi=v:=9; у=18; 51 = 4,009. 


523,201; |Ёэксп | =1,86<foos(18) = 1,73. 


\1-10. Случайная величина Ё: 


ni ула 2 
(ni + п. — 2) (n Di тн. ра хи) 


| п о па 9 27/71 2 сүй; 9 
(ni-n) [nn (D 2, DE EA D xu) "(У 


— имеет Ғ-распределение с параметрами у =1 и Үҙ--П--2. Считается, что 
по сравнению со статистикой і-критерия эта статистика экономичнее в BH- 
числениях примерно на 30%. 


\У1-11. Точный критерий Фишера — необходимо вычислять вероятности 
для следующих трех таблиц: 


4 |4 |: 


б = Е = 


рі == 0,059; рг= 0,005; рз=0,057; У? пр: =0,12. Действенность противогриппоз- 
ной сыворотки неубедительна даже на уровне значимости &=0,1. Если же 
ограничиться уровнем о0--0,05, то достаточно было вычислить значение 
р. =0,059, чтобы убедиться в отсутствии различий. При постановке эксперн- 
мента нарушен принцип рандомизации: выбор · вакцинируемых не должен 
был зависеть от жслания пациентов. 


УП-1. Для анализа таблиц гх2 удобно использовать формулу Бранд- 
та — Снедекора 


4 2 z 2 2 
п: г k n 2 г k; по 
ү? == | ЗИ Е = 2. [У Пе я v=. f; 
Пап тте! n. \ 


п.п. /-Іп.. n 


Д 9 Е 
Хаксп == 7,37 < 710.05 (14) = 23,7. Данные различных авторов о расщеплении по 
окраске семядолей у гороха хорошо согласуются друг с другом. Для про- 


верки согласия с ожидаемым расщеплением №: Ко--3: | удобно использо- 
вать формулу 


ІР, — 36 | — 1,5 „(А = ЗВ | — 1,5)? 
ЕЕЕ ИИ ЕЕ МӘРЕЛІК a 
УЗ (Ё...) г 3 (kı + ko) 

VII-3. п--400; m=4,68. Объединяем классы для 1=0; [и і-10,..., 13, 

чтобы ожидаемые численности превышали 5. Тогда число классов 1- 10; 

у=9; Х2 ки --4,41<х20,06(9) =16,9. Распределение дрожжевых клеток по 

квадратам счетной камеры близко к пауссоновскому. 

УП-4. у-і; 55 = 15,3 > 7%,001(1) = 10,8. Две сравниваемые породы су: 
щественно различаются по устойчивости к американскому гнильцу. 

УП-5. у--5; у = 61,4 > 2,001 (5) =20,5. Возрастной состав больных 


резко изменился, различия значимы при а = 0,001. 
УП-7. у= 1—2. 


хрр 
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УП-8. у--11; у = 737,91 >> хооо = 31,3. Распределение числа рождений 


в разные месяцы высоко значимо отличается от равномерного. В этом слу- 
чае вычисления удобио гооводить по формуле 


ҰТА | 
“11 = --- d (В; m= № k? — rm. 
Із іп [=] == 


У11-9. После объединения классов с малыми ожидаемыми численностя- 
ми имеем /= 15 и у= 14; т =23,7 = 20,05 (14) =23,7. Отклонение от бипо- 
миального распределения можно считать значимым при ас = 0,05, но пе при 
меньших значениях ок. 

ҮШІ-І. уь=3; у= 15; 55,--19,65; 55.--62,03; М5ь=64,55; MSu=4,14; 
F xen = 15,61> оо (3; 15) =11,4. Разные породы кур высоко значимо раз- 
личаются по содержанию гемоглобина. Различие обусловлено разницей 
между породами «итальянские» и «бентамки»: #--2,87>10,25 (15) =2,13; 
и между породами «куропатчатые» и «бентамки»: #--2,48>10,25 (15) =2,48. 


Использование преобразования arcsin И р здесь не правомерно, поскольку 
в задаче речь идет о непрерывной, а не дискретной случайной величине (со- 
держание гемоглобина). 

УШ-2. уь=7; уи=56; 55ь= 1,838; 85 -- 1,185; М$ь=0,263; М5.--0,0212; 
F xen =12,41 > Рооо1(7; 56) =4,1. Четвертый, пятый и шестой индивилы, 
а также седьмой и восьмой образуют две группы, различия внутри которых 
не существенны. Всс остальные попарные сравнения статистически значимы. 


VHI-4. Применяя преобразование үх, получаем  уь-3; уою- 36; 
55, 0,7515; $5$»=13,552; М5ь=0,25055; М5,=0,3764; Г... =0,665< 
<Ео,оѕ (3; 36) = 2,87. Сравниваемые участки практически одннаковы по числу 
бактерий в почве. 


ҮШ-5. Используем преобразование arcsin үр: ve=5; уа=3; vw=15; 
$$ь= 1,095; 554--1,711; 55,--0,361; М$ь=0,219; М5,=0,570; М5, =0,021; 
F rco =М$ь/М$ ь =9,125> Ро! (5; 15) =7,6; Еп =М$а/М$ и, =23,75> 
> Р 0,001 (3; 15) =9,3. 

Таким образом, значимыми оказываются различия как между сортами, 
так и между блоками. 

ҮПІ-6. Используем преобразование lgx: уь=3; Үш--24; 55ь= 12,228; 
55, =0,2287; М5ь--4,0761; М8,--0,0095; Е ken =427,8 » Ер,о01 (3; 24) =7,55. 
Численности всех четырех видов планктона резко различаются. 

VIII-7. В письме Ч. Дарвину Ф. Гальтон по существу сформулировал 
одну из первых непараметрических процедур сравнения двух независимых 
выборок равного объема, которая впоследствии получила название крите- 
рия Гальтона. 

Более эффективным является применение критерия Крускала — Уоллиса. 
Для перекрестноопыленных растений имеем H gea =0,165<%20,0 (3) =7,82, 
т. е. все четыре выборки перекрестноопыленных растений достаточно одно- 
родны. Для самоопыленных растений хол (3) -6,.25<Н, сп = 6,2<%20,05 (3) = 
--7,82, т. е. выборки самоопыленных растений менее однородны, чем выбор- 
ки перекрестноопыленных растений. Этот вывод может представлять само- 
стоятельный интерес для биолога и быть предметом дальнейшего изучения. 

Сравнение объединенных данных для перекрестноопыленных и самоопы- 
ленных растепий с помощью критерия Вилкоксона -- Манпа-- Уитни указы- 
вает на высоко значимое различие между ними: U yen =39,5> Ош (15; 
15) =40, т. е. подтверждает вывод Ч. Дарвина и Ф. Гальтона. 

К подобным выводам мы приходим, используя обычный дисперсионный 
анализ. Для перекрестноопыленных растений уь=3; ую+ 11; 885, = 13,036; 
$5 ь = 170,116; М$ь=4,345; М5,= 15,465; F zcn =0,28< Foos (3; 11) =3,59. 
Для самоопыленных растений уь=3; уџ=11; 9$ь=95772; 55,--33,159; 
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М$ь= 8,591; М5,= 3,014; Fon (3; 11) =2,66<F сп =2,85<Ео,о (3; 11) =3,59. 
Сравнение объединенных выборок дает [5,02 (28) =2,05< |f ксп |=2,44< 
< 0,005 (28) =2,76. 

1Х-1. Испытания Ги П не являются незавесимъми, силу связи можно 
изменять, подбрасывая повторно разное число костей. 

1Х-3. Графический анализ данных показывает, что зависимость между 
массой тела (хі) и долей массы мозга от общей массы (хә) у тюленя не 
является линейной. Действительно, у--5 и fyken =— 0,83; по абсолютной Be- 
личине это значение меньше, чем 70,05 (5) -- 0,88, т. е. корреляция незначима 
при 0--0,05 или же она нелинейна. После логарифмического преобразования 
lg xı и 16 хг зависимость линеаризуется, Faken ----0,99 и корреляция оказы- 
вается значимой при 0--0,001, так как го,оооѕ (5) = 0,95. 

ж 

[Х-4. у--1,02--2,06 х. 

ІХ-5. у--4; х2 сп =4,02<%20,05 (4) = 9,49. Зависимость между односторон- 
ностью в развитии рук и глазной односторонностью практически отсутствует. 

ІХ-7. Если считать фиксированными результаты измерения обычным ме- 

ж 
тодом, то у--15,35--0,975 х; если фиксированными считать результаты 13- 
AN 
мерения новым методом, TO x=7,25+ 1,02 у (регрессия x по y). В обоих 
случаях гипотеза Но: В=1 принимается: 5ь= 0,025; у-16 и |! 
<< |5--В |/5ь = (1,0 ИЛИ 0,8) < to,o25 (16) =2,12. 

Строго говоря, это еще не означает, что оба метода дают одинаковые 
результаты. Необходимо, чтобы В=1, и одновременно линия регрессии дол- 
жна проходить через начало координат; процедуру проверки такой гипотезы 
см. у К. А. Браунли [1977, с. 333—336]. Проще, однако, использовать парный 
і-критерий: та--34,17; ѕа= 14,06; |f ken |--2,.43>10,0% (16) =2,12, и гипотеза 
об одинаковости результатов, получаемых двумя методами, отвергастся 
при о = 0,05. 

ІХ-8. 1 А=1п А —ур. Соответствующее уравнение регрессии есть 
Іп А--4,60--0,513 О, т. е. у=0,51. 


1Х-9. 71=100,1—5,79 х; у--98,5--5,34 х. 
ж 
ІХ-10. у--1,71-0,455 х, где y=lg Q; х-|е Т. 
[Х-11. Нет. Уже на глаз видно, что выборочное двухмерное распределе- 
ние не является нормальным. 


1Х-12. у-4; Ха =10,47 > Xó 05(4) --9,49. Зависимость между полом 


ребенка и цветом волос у шотландских детей следует признать значимой 
при &=0,05. 


[Х-13. у=4; х2 еп -160,52>Х2.0і (4) --18,5. Связь между конституцией 
ягнят при рождении и в полуторагодовалом возрасте несомненна. 


эксп 


ІХ-14. у= 18; гоп = —0,256; |Гоксл | </о,025= 0,44. Линейная корреляция 
между полярностью и гидрофобностью аминокислот практически отсутствует. 
Ранговая корреляция век =—0,33 также оказывается незначимой: 


|ивәксп 1 <78 (0,025) = 0,45. 
[Х-15. у=266; [|F kcen |= 0,5232 го,оо: = 0,21. Корреляция слабая, но ста- 
тистически значимая. Для группированных данных рекомендуется использо- 


вать формулу 
Е | k l 
n 24 ры пух — р ПІ. ХІ Йа пау) 
k 92 k 2 L 2 { 2 й 
|а Da пух; — (22 nix) | |п ры n.jyj— БЖ ИД | 


1Х-17. Находим ба и 0,, такие, что P (8, <р < be) = 1 — а, а именно 
вн == 6 = 12 7 $в И бв = Ё + Ё о е SB. 


r = 
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ГХ-18. Следует использовать 2 — преобразование Фишера или 2%-- преоб- 
разование Хотеллинга (для малых выборок‘. Тогда можно найти 2н и Zp, 
21 1+ р р 
такие, что Р 42. - Іп 1—6 < Zat = 1 — а. Для этого надо найти Z= 2 — 
1 
шайы тра Ипя-з3” на 


z Затем следует провести обрат- 

n — 

ное преобразование (используя табл. ХИ, 6 Приложения) и найти искомое 
v ж ЕНЕР 

Fa И “в. В случае малых выборок (и >> 10) надо найти 2, = 2* — из. Пип = 1 

3 въз 
--- 7% г 
И Zg = 2“ + и.о. ЖЕНЕ 


ІХ-19. Случайная величина ш--(2,-Егі)Г/ Dzi ~N (0;1), следовательно, 


5 u; ү? (y), у = 1. I ипотеза Ho: р =... = рь = р равносильна гиПотезе 
Но; Eu, =... = Eug = 0. Тогда, если в качестве оценки нулевого математи- 
— 1 в ~ k 1} == т 
4 и Л 
еского ожидания использовать M, = и, to м о ү? (у 
+ Д и k Рани у «| --1 т, ү? (9), 


= № 1. 


[Х-20. Для данных примера “1-4: у = 14; г. сп = 0,996. Между резуль- 


татами определения крахмала двумя методами имеется чрезвычайно высокая 
корреляционная зависимость. 


Для данных примера 1-9: г; Giai 0.71 > F s0065) (14) = 0,68; корреля- 
ция значима при а = 0,01. 

Для данных задачи У1-2: у--3; г, су =0,96 = го,ооѕ (3) =0,96; корреляция 
значима при с--0,01. 

Для данных задачи \1-9: у--8; fiken =0,80> 70,0005 (8) =0,87; корреляция 


значима при о = 0,001. 
Дисперсия разности двух случайных величин есть 


р( — 9) = рӯ, + рӯ, — % V рула: 


Парные критерии автоматически учитывают компоненту, обусловленную кор: 


реляцией: Р(х, —хг) -Е(хі-х2)2--ГЕ(хі-х) Т. 

ІХ-21. foken = 0,072. Корреляция чрезвычайно слабая, хотя и статисти- 
чески значима. 

[Х-22. «Действительно, по статистическим данным оказывается, что 60- 
гатые люди, пользующиеся этими предметами, выше, здоровее и живут 
дольше, чем те люди, которые никогда не помышляют о приобретении таких 
вещей. Не требуется большой проницательности, чтобы видеть, что эта раз- 
ница в действительности создается не цилиндрами и зонтиками, а тем богат- 
ством и питанием, о которых они свидетельствуют, и что золотые часы и 


членство в клубе на Пэл- Мэл имеют такие же превосходные свойства» 
(Б. Шоу, 1906 г.). 


ПРИЛОЖЕНИЕ 


Таблица I. Равномерно распределенные случайные числа (см. гл. № 84 
и гл. ІУ, 6 3) 


85 017 85 532 13 618 23 157 86 952 02 435 
16 719 82 789 69 041 05 545 44 109 05 403 
65 842 27 672 82 186 14 8711 22 115 86 599 
76 875 20 684 39 187 38 976 94 324 43 204 
93 640 39 160 М 453 98 319 41 548 93 137 
99 478 10 086 71 265 11 7142 18 226 29 004 
65 119 26 456 47 353 43 361 99 45 42 153 
7 322 21 592 48 933 93 806 32 581 21 573 
58 113 4! 278 11 679 49 540 61 7/7 67 924 
44 655 81 225 3 133 25 768 60 452 38 697 
02 295 13 487 98 662 07 092 44 673 61 303 
85 085 54 881 36 587 43 30 48 597 48 4-95 
01 197 86 935 28 021 61 570 23 350 65 710 
97 907 19 078 40 646 31 352 48 625 44 359 
63 268 96 905 78 797 57 048 46 359 71 294 
53 841 59 684 67 411 09 243 56 092 54 369 
53 712 71 399 10 96 07 959 21 225 13 08 
11 434 51 98 62 171 9 752 25 98 02 400 
62 375 99 292 21 177 12 621 66 995 (7 289 
28 337 20 923 87 929 61 020 62 84 31 374 
38 631 79 430 62 421 97 959 бт 422 69 59 
49 172 16 332 44 670 35 089 17 691 89 246 | 
89 232 57 327 34 679 62 235 79 655 81 336 
02 844 15 06 52 439 58 587 48 274 81 330 
40 387 65 406 37 929 08 709 60 623 22 231 
80 240 44 177 51 ІП 08 7 39 323 05 17098 
44 910 99 321 72 173 56 239 04 595 10 835 
33 663 86 347 00 926 44 915 34 823 51 1770 
86 430 19 102 37 420 41 876 76 569 24 358 
31 379 68 88 81 675 15 694 43 43 36 819 
03 474 37 55 36 954 73 661 46 986 37 162 
97 742 46 162 42 811 45 720 42 533 23 1792 
16 766 22 7166 56 502 67 107 32 907 97 859 
12 568 59 926 56 566 82 731 05 037 29 35 
55 505 6) 564 38 548 24 622 3 624 30 990 
16 227 79 439 49 544 35 482 17 379 32 378 
84 421 75 351 57 245 50 688 77 047 44 167 
63 016 37 859 16 955 56 19 98 105 07 175 
33 21 23 429 78 645 60 782 52 420 74 438 
57 608 63 24 09 472 79 654 49 174 60 962 
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т чи 6660 тоевенсо 560 ‘0000 іәеҺһенғо „00, 


с60 80160 656 0 780 0 21460 90560 сСЕ6 0 1656 "0 с0еб 0 18660 p 
1366'0 +!66'0 0966: £866'0 566 () 81660 6860 98690 0860 1260 Z 
1460 5960 соб'0) ` С76'0 LEGO 616'0 0060 о980 990 19% Į 
6060 с680 45! 1690 608% 9080 7080 1680 6180 о: 60 
15.0 1:80 8080 9060 0080 0080 1640 7640 1620 83/0 90 
с‘) $810 60 9770 е 10 OLLO 1940 7910 192'0 80/0 10 
се) 6970) 6510 СРО СР) УАТ 9670 се 0 601% 901% 9% 
ZOLO 6140 011% GILO 60L‘0 co0L‘0 с020 8690 069% 1690 сч 
8890 7890 1890 149%9 7100 0/90 909% 699% 699“0 6994) $'0 
240%) 890 F90 ТР 1690 сеч 6.90 9г9 (0) 5099 8190 2‘0 
t190 019%9 909% е09%0 666% e630 1640 1860 с940 6/<'0 са 
с16'0 1160 190%) 990 093'0 пее4) с96% Өге% рғ 0 0Р0) го 
95670 сес 0 809% рес“) Осе“0 а%0 0140 904% Р00%0 000%0 0:0 
9Р0 8980 СО 9870 940 PRHO 882.0 с6Ъ'0 96+'0 С08'0 00-- 
Чад! 63t 0 ес) дер CH'O РРО орг 0 6070 де: ‘0 09% 0 10 - 
980 068'0 660 1660 ТОРО СОЖ" 600 $170 LIKO ТРО CO - 
378'0 сее“) 966% бсеч) 09.0 19650 1160 реч) 6,700 2800 с%-- 
СЕО 975'0 615'0 наз 966% (66%0 1255 186% THEO орс%0 0 - 
8260 735'0 820 386.0 166.0 96070 5600 05'0 с08'0 6060 со - 
СУС (0 372.0 16020 9600 800 195.0 900 5920 1700 +100 90: 
910% 81240 иа LEAN 4660 0620 EEZ 0 960 0 66070 СУС 20- 
1810 63 "0 с6г0 с6190 8610 (020 $05.0 9000 605.0 0100 80- 
1910 2910 9910 6910 ШАҚ! 71:0 9/1'0 6410 1810 7810 60- 
620% 9е0“0 3700 000 1900 1800 1600 СТО 91:0 6910 [== 
6100'0 92000 06000 17000 9000 С800% 1100 100 8100 £300 сЕ 
ӛрң0% 010% 11:00 91:00 260 - #00 870 0 69:00 1656040 ? 900 пън 
6 8 4. 9 G ? H G І 0 п 


то) мет “іл >n} d= (п) ф винэвене NHE 


„(ИГ 701 p 8 иә) БвинэгэпэдиоеЯ олончгвидон випянАф || ВПИГОЕ |. 


теты Аласа? 


255 


Таблица 11. Ғ-распределение Стьюдента (см. $ 8 гл. 11) 
В последней строке даны значения нормированной нормальной случайной величины 
Ё (е) = u ~ М (0; 1) 
зан 


P {iTi >t) 


0,10 | 0,05 | 0,02 | 0,01 | 0,002 | 0,001 


Р(Ғ>14) или ВР 


0,05 | 0,025 | 0,01 | 0,005 | 0,001 | 0,0005 
1 6,31 12,7 31,8 63,7 318 637 

2 9:99 4.30 6,96 9'92 20 3 31,6 

3 2.35 3,18 454 5184 10,2 129 

4 213 2,78 3.75 4.60 717 8,61 
5 9 02 2,57 3.36 403 589 6,87 
6 194 945 214 3.71 5,2] 5,96 
7 1'89 2,36 %00 3,50 4,79 5,41 
8 1:86 2,31 2'90 326 45) 5,01 
9 183 2,96 289 3.95 430 4.78 
10 181 2,93 2'76 317 414 4,59 
11 1'80 290 2779 за 4.02 4.44 
12 1,78 218 2.68 3,05 3,93 432 
13, 177 216 2 65 3,01 3,85 4:99 
14 1.76 914 269 2,98 3'79 4,14 
15 175 213 2'60 2,95 3,73 4.07 
16 175 2 12 2.58 2,92 3,69 402 
17 1.74 211 2.57 29) 3,65 3.97 
18 1,73 210 9:55 2'88 3,61 3.92 
19 1.73 2'09 9:54 9,96 3,5% 3.88 
20 | 72 2'09 2.53 985 3,55 3 85 
92 1772 2,07 251 2,89 3,51 3.79 
24 1.71: 2.06 2,49 2,80 3,47 3,75 
26 1.71 206 2.48 2.78 3,44 371 
28 170 9 05 9.47 216 3,41 3,67 
30 1770 2 04 246 2,75 3.39 3.65 
39 1,69 2.04 2'45 2.74 337 3.62 
35 1.69 2,03 2'44 9792 3,24 3,59 
40 1,68 2,02 249 270 3,31 3.85 
50 1.68 2.01 240 2,68 3,26 3,50 
60 167 2,00 2'39 2.66 3,23 3,46 
80 1,66 1,99 937 964 3,20 3,42 
100 1,66 1,98 236 263 3,17 3.29 
150 166 1,98 2 35 2,61 345 2,25 
300 1,65 1,97 2,34 2,59 3,12 33) 
1000 1.65 1,96 2 33 2,58 3,10 3.30 
оо 1,64 1,96 2,33 2.58 3,09 2,29 


236 


a 
- 


0% IKI 01 с: ӘРІ 101 191 
801 SIT с1 “ғ. Жу 901 991 
ст 6410901 91 00: 191 0/1 
съ 151 SET Сер вт 991 С 
ел ІМ ОРІ ее СГ сор 181 
11 6р 991 $497 т 181 261 
917 391 197 Рг УТ €} 10% 
ст 191 OLI ШТ 187 961 #05 
697 00р У 087 06) 661 105 
ет PL'I 8L} +87 161 06 ПС 
801 081 681 681 867 Дс SIZ 
ҮЗІ 981 686% 961 804 16 000 
61 $6 9671 02 HZ 675 6 
100 502 90 Пе 6156 865 560 
EIZ #6 Ше 64 WEZ 660 905 
0660 160 565 866 С 166 096 
795 50 196 592 Шс ио 985 
Шс се те 625 986 260 196 
660 %60 966 юе 806 СЕ 006 
906 ee 906 066 866 ЊЕ Е 
19° 892 OLE ФЕ 186 188 3466 
18% 16% бер ӨР 09р 909 597 
606 99 406 600 лс 06806 989 
508 %08 998 708 (08 998 018 
ср 961 961 961 961 %6 61 
755 %0 60 6% 00 %0 9% 


969 
618 


6! 
СУС 


988 
76! 


655 


Сї і сч еї СЧ сч 


<#> со е О 
С.) СЧ а яз — ч 


768 
76! 


PEG 


106 
"61 


086 


LEZ 
866 
otg 
РС 
95 
192 
696 
ILZ 
ма 
87% 
08% 
18“ 
62 
юе 
пе 
95.6 
Зу 
со" 
у8е 
rA 
сс? 
616 
669 
2146 
«а! 


906 


сб! 


916 


595215855 
са со со со со со со со 


хе сл со 0 ст со <> 


ОТР 
96 ғ 
9ғ? 
А 
рге 
бре 
769 
006 
061 


000 


237 


e] Nmn < о О г. оо о 


с00 = (4 <а! d (е 
(11 у: 6 9 #2) вдэтиф—едохэмон)) Финооподповй-у СЛІ ҰПИГОРЦ 


901 егі ве 1 6671 19 | 141 $81 с0 6 612 176 28% 6/70 СЕ 606 с) с оо 
501 911 да 1 ІР 8671 04/1 581 90% 06.5 АЖ 886 08 еге ше 7073 0901 
8Г1 601 161 си | 591 6/4 881 60% 85.5 сӯ С 190 е8 с 9Ге 245 80% COE 
021 pel ОТ 551 891 581 761 Гб 08:5 19% 196 6820 сб 6 096 чи: 901 
егі 191 90 191 081 #61 90% 126 да 59% 61% 106 432 сб Е 605 09 
91 991 171 081 76 1 406 812 бег gg 725 06% еге оре 50% Ад. (ғ 
6/1 181 981 #61 02 066 IEZ 16% с9% 78% со ча бес 817 754 oF 
св 1 981 681 861 116 25 6 FEZ 54% 69% 06% 908 65 $ со 66+ 199 86 


8841 061 761 goz 915 85.5 бег 66“, Ма 766 0ТЕ есес 79% 15% 99% 92 
76'1 с61 00% 80‘ 15.5 ес“ РУС ғ9% СУМА 662 сг ве с ZLE сет 2/9 7, 
00% 00% 90% PIZ 166 бес 06% 045 78 co'e «Ач Рус 87% ве? 62 00 
60% 01% РІС оС соо ОРС 279% LIT 162 еге 65$ 16< 98% ОРФ 18% 05 
61“ 0с АА се РРС 96%, 79% 18% 108 «4 85.6 198 сб 98% 86' 81 
ес ес“ LEZ ср 18% 80%, ба 66“ се уес 06% ее 80% 69% 219 91 
6Р6 062 5% 19% е/% 28.5 с6“ сие бге 06% 99% 68% РСР 98% 069 РІ 
пе PLC 82% 08%, 965 29% SIE LFS 15% еле 686 61% ғ” 019 с99 ZI 
80< 604 еге 025 18'6 СУС 644 04% ос 70% РС Y 17% ев? др 769 01 
есе сев 88.6 оре 96% 19% 14% 96% 01% СЕР 87 02% 805 1744 IZZ G 
194 894 А? 874 652 007 01% 05% Фу 69% 08% 004 Сус 909 26% 8 
РГР ОГУ 617 сб% дер /у+ 168% а/% 06% 21% бес ссс 68с yo'9 108 L 
cgt 9957 68% 967 109 71% 204 де 09% 08% 664 659 099 924. 188 9 
0609 е0%9 9049 019 ег9 ее'9 АД 299 9/9 869 чи! 667 9/4 еу8 0010 
908 108 068 968 978 95% 99% YRR 86'8 05.6 966 096 86:6 901 24 Р 
61 6'51 6'Е1 0%1 ща 42 а ма а ма 2 ге хе! 091 FLI е 
5.68 666 с6е 566 9.68 у6е ғ6е »бе ғбе ебе 8.65 5.68 058 0.68 сөс Z 
с86 696 156 186 606 006 798 008 879 I 


в50'0={<-}а (9 


т” 


Ат мпикговг згинежиоподу 
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001 SI'I 621 491 074 881 ?00 26% 160 080 0086 (ее 818 197 599 
П 614 се 004 021 0641 305 PEG esz (485 woe pee 086 бт 999 
521 801 веч 604 974 761 OIZ 866 194 986 806 826 588 89% 2/9 
лет IpI 671 991 981 5004 616 с 996 966 ЛЕ Е 366 87 789 
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108 <%0% 605 166 688 64 016 86 ПРО РЕ 026 00% 16% 6ес 098 
90 606 Ис 964 ЮФ 094 ХО goe eze ж 7 </6 70% 76% СРС #97 
е! 6 01% 122 се“ 00% 99% 08% 606 6 66% 58% ГУ РФ 55.3 621 
IGG 66 606 OZ 8695 МЕ 686 116 966 196 066 708 2/9 199 87 
IEG 665 885 060 797 87 867 ОФ се 09/2 664 167 вр 7/70 661 
се Мб 069% 195 816 568 606 ес 0906 18° ОР Ф 76у 586 OIR 
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916 146 156 св Іс ese gre ese 696 986 168 SIr У 867 9599 3 
9029 149 5959 869 979 с49 S99 СВО 760 612 9%: 797 108 $28 901 ? 
961 961 161 861 661 10 805 905 805 112 РС 815 956 165 995 © 
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Таблица У. Распределение y? (см. $ 7 гл. 11)" 


Оо мло от ы 65 ко + 


— е 
- СО 


50 
100 


г (үзсе уа) 
0,995 0,975 0,1 0,05 0,025 0,01 0,005 0,001 
0,044 0,001 2,71 3,84 5,02 6,63 7,88 10,8 
0,010 0,051 4,61 5,99 7,38 9,21 10,6 13,8 
0,072 0,22 6,25 7,81 9,35 11,3 12,8 16,3 
0,21 0,48 7,78 9,49 11,1 13,3 14,9 18,5 
0,41 0,83 9,24 ша 12,8 15,] 16,7 20,5 
0,68 1,24 10,6 12,6 14,4 16,8 18,5 22,5 
0,99 1,69 12,0 14,1 16,0 18,5 20,3 24,3 
1,34 2,18 13,4 15,5 17,5 20,1 22,0 26, 1 
1,73 2,70 14,7 16,9 19,0 21,7 `23,6 27,9 
2,16 3,25 16,0 18,3 20,5 25,2 25,2 29,6 
2,60 3,82 17.3 19,7 21,9 24,7 26,8 31,3 
3,07 4,40 18,5 21,0 23,3 26,2 28,3 32,9 
3,57 5,01 19,8 22,4 24,7 27,7 29,8 34,5 
4,07 5,63 21,1 23,7 26, 1 29,1 31,3 36,1 
4,60 6,26 22,3 25,0 27,5 30,6 32,8 37,7 
5,14 6,91 23,5 26,3 28,8 32,0 34,3 39,3 
5,70 7,56 24,8 27,6 30,2 33,4 35,7 40,8 
6,26 8,23 26,0 28,9 31,5 34,8 37,2 42,3 
6,84 8,91 27,2 30,1 32,9 36,2 38,6 43,8 
7,43 9,59 28,4 31,4 34,2 37,6 40,0 45,9 
8,03 10,3 29,6 32,7 35,5 38,9 41,4 46,8 
8,64 11,0 30,8 33,9 36,8 40,3 42,8 48,3 
9,26 11,7 32,0 35,2 28,1 41,6 44,2 49,7 
9,89 12,4 33,2 36,4 39,4 43,0 45,6 51,2 
10,5 13,1 34,4 37,7 40,6 44,3 46,9 52,6 
11,2 13,8 35,6 38,9 41,9 45,6 48,3 54,1 
11,8 14,6 36,7 40,1 43,2 47,0 49,6 55,5 
12,5 15,3 37,9 41,3 44,5 48,3 51,0 56,9 
13,1 16,0 39,1 426 45,7 49,6 52,3 58,3 
13,8 16,8 40,3 43,8 47,0 50,9 53,7 59,7 
28,0 32,4 63,2 67,5 71,4 76,2 79,5 86,7 
67,3 74,2 118,5 124,3 129,6 135,8 140,2 149,4 
* 0,0*4 означает 0,00004. 
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Таблица VI. Точный критерий Фишера (см. 8 4 гл. УГ) 
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Продолжение таблицы VI 
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Окончание таблицы VI 
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Таблица УП. Непараметрические доверительные пределы для медианы 


0,90 | 0,95 0,98 | 0,99 | 0,998 | 0,999 
Р (ез œ < ( <Xin-b41)} или P (Хы << оф) 
0.95 | 0,975 | 0,99 | 0,905 | 0,999 | 0,9995 
Во 6—8 7—10 8—11 10—13 11—14 
2 8—10 9—11 11—13 12—14 14—17 15—18 
3 11—12 12—14 14—16 15—17 18—20 19—21 
4 13—15 15—16 17—18 18—20 21—23 29—94 
5 16—17 17—19 19—21 21—23 24—26 25—27 
6 18—20 20—22 299—924 24—25 27—29 28—30 
7 21—22 23—24 25—26 26—98 30—32 31—33 
8 23—25 25—97 27—29 29—31 33—34 34—36 
9 26—27 28—29 30—32 32—33 35—37 37—39 
10 28—29 30—32 33—34 34—36 38—40 40—41 
11 30—32 33—34 35—37 37—38 41—42 42—44 
12 33—34 35—36 38—39 39—41 43—45 45—47 
13 35—36 37—39 40—41 42—43 46—48 48—49 
14 37—39 40—41 42—44 44—46 49—50 50—52 
15 40—41 42—43 45—46 47—48 51—53 53—55 
16 42-43 44—46 47—49 49—51 54-55 56—57 
17 44—46 47—48 50—51 52—53 56—58 58—60 
18 47—48 49—50 52—53 54—56 59—60 61—62 
19 49—50 51—53 54—56 57—58 61—63 63—65 
20 51—52 54—55 57—58 59—60 64—65 66—67 
21 53—55 56—57 59—61 61—63 66—68 68—70 
22 56-457 58—60 62—63 64—65 69—70 71—72? 
23 58—59 61—62 64—65 66—68 7173 73—75 
24 60—61 63—64 66—68 69—70 74—75 76—77. 
25 62—64 65—66 69—70 71—72 76—78 78—80 
26 65—66 67—69 71—72 73—75 79—80 81—82 
27 67—68 70—71 73—75 16—17 81—82 83—85 
28 69—70 72—73 76—77 78—79 83—85 86—87 
29 71—73 74—76 78—79 80—82 86—87 88—89 
30 74—75 77276 80—81 83—84 88—90 90—92 


(см. $ 7 гл. V) 


Р |) <E < хаар) 


247 


Таблица VIII. Критерий Вилкоксона — Манна — Уитни (см. $ 7 гл. VIJ 


по 


т 


а[2 


0 О оо с 
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q 7994 томы = 


— үшы 7-54 үзе-ф gyd 


Таблица ІХ, Парный критерий Вилкоксона (см. 8 8 гл. УГ) 


а= РИ < W) 
0,1 | 0,05 | 0,09 | 001 | 0.002 | 0,001 
N 
а[2 =P{W < W} 

0.05 | 0.025 | 0,01 | 0,005 | 0,001 | 0,0005 
5 0 
6 Ў 0 
7 3 9 0 
8 5 3 0 
9 8 5 3 І 
10 10 8 5 3 0 
11 13 10 7 5 0 
12 17 13 9 7 9 ] 
13 21 17 19 9 4 ; 
14 25 21 15 19 6 4 
15 30 95 19 15 8 6 
16 35 99 93 19 1 8 
17 41 34 - 97 23 14 11 
18 47 40 39 27 18 14 
19 53 46 37 32 21 18 
20 60 52 43 37 26 91 
91 67 58 49 49 30 95 
92 75 65 55 48 35 30 
93 83 73 62 54 40 35 
94 91 81 69 61 45 40 
25 100 89 76 68 51 45 
26 110 98 84 75 58 51 
27 119 107 92 83 64 57 
28 130 116 101 91 71 64 
29 140 196 110 100 79 71 
30 151 137 120 109 86 78 
31 163 147 130 118 94 86 
39 175 159 140 198 103 94 
33 187 170 151 138 119 109 
34 200 182 162 148 191 111 
35 213 195 173 159 131 12 
36 227 208 185 171 141 130 
37 941 991 198 182 151 140 
38 956 935 211 194 162 150 
39 271 249 224 207 172 161 
40 286 264 238 290 185 172 
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р F $ 999 се с 
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Таблица XI. Распределение выборочного коэффициента корреляции 
Пирсона при р=0 (см. 6 7 гл. ІХ) 


РИ || > г) 
0,1 | 0,05 | 0,09 | 0,01 | 0,002 | 0,001 
y 
Р (ғ > г) ИЛИ Р {r <— г) 
0,05 | 0,025 0,01 0,005 | 0,001 | 0,0005 
1 0,99 1,00 1,00 1,00 1,00 1,00 
2 0,90 0,95 0,98 0,99 1,00 1,00 
3 0,81 0,88 0,93 0,96 0,99 0,99 
4 0,73 0,81 0,88 0,92 0,96 0,97 
5 0,67 0,75 0,83 0,87 0,94 0,95 
6 0,62 0,71 0,79 0,93 0,91 0,92 
7 0,58 0,67 0,75 0,80 0,88 0,90 
8 0,55 0,63 0,72 0,76 0,85 0,87 
9 0,52 0,60 0,69 0,73 0,82 0,85 
10 0,50 0,58 0,66 0,71 0,80 0,82 
11 0,48 0,55 0,63 0,68 0,77 0,80 
19 0,46 0,53 0,61 0,66 0,75 0,78 
13 0,44 0,51 0,59 0,64 0,73 0,76 
14 0,43 0,50 0,57 0,62 0,71 0,74 
15 0,41 0,48 0,56 0,61 0,69 0,73 
16 0,40 0,47 0,54 0,59 0,68 0,71 
17 0,39 0,46 0,53 0,58 0,66 0,69 
18 0,38 0,44 0,52 0,56 0,65 0,68 
19 0,37 0,43 0,50 0,55 0,64 0,67 
20 0,36 0,42 0,49 0,54 0,62 0,65 
25 0,32 0,38 0,45 0,49 0,57 0,60 
30 0,30 0,35 0,41 0,45 0,53 0,55 
35 0,28 0,32 0,38 0,42 0,49 0,52 
40 0,26 0,30 0,36 0,39 0,46 0,49 
45 0,24 0,29 0,34 0,37 0,44 0,47 
50 0,23 0,27 0,32 0,35 0,42 0,44 
60 0,21 0,25 0,30 0,33 0,39 0,41 
70 0,20 0,23 0,27 0,30 0,36 0,38 
80 0,18 0,22 0,25 0,28 0,34 0,36 
90 0,17 0,21 0,24 0,27 0,32 0,34 
100 0,16 0,20 0,23 0,25 0,30 0,32 
200 0,12 0,14 0,16 0,18 0,22 0,23 
300 0,10 0,11 0,13 0,15 0,18 0,19 
500 0,07 0,09 0,10 0,12 0,14 0,15 
1000 0,05 0,06 0,07 0,08 0,10 0,10 
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Таблица ХИ. Преобразовани. коэффициента корреляции Пирсона 
(см. $ 8 гл. ІХ) 


1 г 
а) z=5 1п 5 


0,7 0,87 0,89 0,91 0,93 0,95 0,97 100 102 105 1,07 


0,9 147 1,53 1,59 1,66 1,74 1,83 1,95 2,09 2,30 2,65 
0,99 265 270 2,76 2.83 2,90 2,99 311 3,25 3,45 3,80 


Продолжение таблицы XII 
б) r= (e7 — 1) (e + 1) 


0,0 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,1 0,10 011 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 
0,2 0,0 0,21 022 0,23 0,24 0,24 0,25 0,26 0,27 0,28 
0,3 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,35 0,36 0,37 
0,4 0,38 0,39 0,40 0,41 0,41 0,42 0,43 0,44 0,45 0,45 
0,5 0,46 048 0,49 049 0,50 051 0,52 0,52 0,53 0,54 
0,6 0,54 0,55 0,56 0,56 0,57 0,58 059 0,59 0,60 0,60 
0,7 0,61 0,62 0,62 0,63 0,64 0,64 0,64 0,65 0,65 0,66 
0,8 0,66 0.67 0,68 0,68 0,69 069 0,70 0,70 0,71 0,71 
0,9 0,72 072 0,73 073 0,74 0,74 0,4 0,75 0,75 0,76 
1 0,76 0.80 0,83 0,86 0,89 0,01 0,92 0,04 0,95 0,96 
2 0.95 007 0,98 0.98 0,98 0,99 0,99 0,991 0,993 0,994 


Таблица ХИТ. Распределение коэффициента корреляции Спирмена 


100 


0,05 


0,025 


1,00 
0,89 
0,79 
0,74 
0,70 
0,65 
0,62 
0,59 
0,56 
0,54 
0,52 
0,50 
0,48 
0,47 
0,46 
0,45 
0,44 
0,43 
0,42 
0,41 
0,40 
0,39 
0,38 
0,38 
0,37 
0,36 
0,31 
0,28 
0,26 
0,22 
0,20 


(см. 8 9 гл. ІХ) 


Р ІС > га) 
| 0,02 | 001 | 
р ТА > гу} или P Е 


| 0,01 | 0,095 | 


1,00 

0,94 1,00 
0,89 0,93 
0,83 0.58 
0,78 0,83 
6,75 0,79 
0,71 0.76 
0,68 0,73 
0,65 0,70 
0,62 0,68 
0,60 0.65 
0,58 0,64 
0,57 0,62 
0,55 0,60 
0,54 0,58 
0,52 0,57 
0,51 0,56 
0,50 0,54 
0,49 0,53 
0,48 0,52 
0,47 0.51 
0,46 9,50 
0,45 0.49 
0,44 0,48 
0,43 0,46 
0,43 0,47 
0,37 0,41 
0,33 0,36 
0,30 0,33 
0,26 0,29 
0,23 0.26 


0,002 


Ж аа \ 
бейді 


GOJI 


1,00 
0,95 


0,92 


0,88 
0,85 
0,82 
0,79 
0,77 

0,75 
0,73 
0,71 

0,70 
0,68 
0,66 
0.65 
0,63 
0,62 
0,61 

0,60 
0,59 
0,58 
0,57 
0,56 
0,55 
0,48 
0.43 
0,39 
0.34 
0,31 


1,00 
0,98 
0,93 
0,90 
0,87 
0,85 
0,82 
0,80 
0,78 
0,76 
0,75 
0,73 
0,71 
0,70 
0,68 
0,67 
0,65 
0,64 
0,63 
0,62 
0,61 
0,60 
0,59 
0,58 
0,51 
0,46 
0,42 
0,36 
0,33 
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